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P 61438 We/- 

Verwendunq des multifunktionellen Transkriptionsfaktors 
Yin- Yang- 1 und Varianten davon zur Behandluncr von Erkrankun- 
gen, insbesondere von Typ-1 Diabetes 

ie vorliegende Erfindung betrifft die Beeinf lussung der Akti- 
itat und/oder der Expression des multifunkti one lien Tran- 
skriptionsfaktors Yin- Yang- 1 (YY1) und Varianten davon zur Be- 
handlung verschiedenster Erkrankungen . Die Erfindung betrifft 
insbesondere eine mutierte Nukleinsauresequenz, die fur eine 
Variante des humanen YY1 kodiert und der erf indungsgemaS eine 
diabetesprotektive Wirkung zugeschxieben wird. 

Einfuhrung 

Der insulinabhangige Typ-l-Diabetes (IDDM- Insulin-Dependent 
Diabetes Mellitus) ist eine komplexe Erkrankung, bei der zel- 
lulare und humorale Immunprozesse ablaufen, die eine ZerstS- 
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rung der korpereigenen insulin-produzierenden Beta-Zellen zur 
Folge haben. Man spricht daher beim Typ-1 -Diabetes von einer 
Autoimmunerkrankung . Es besteht heute kein Zweifel mehr, daS 
der Typ-1 -Diabetes genetisch determiniert ist. Gesichert ist, 
dafi bestimmte Klasse-II-Gene des Haupthistokompatibilitatskom- 
plexes (MHC) , der beim Menschen als HLA (Human Leucocyte Anti- 
gens) bezeichnet wird, an der Entstehung des Typ-1 -Diabetes 
beteiligt, aber allein nicbt ausreichend sind. Diese diabetes- 
suszeptiblen Klasse-II-Gene, die als IDDM1 bezeichnet werden, 
erklaren nur etwa 40% des Risikos, an einem Typ-1 -Diabetes zu 
erkranken. Daher wurde in den letzten Jahren versucht, chromo- 
pale Regionen mit diabetogenen Nicht-MHC-Genen zu lokali- 
eren. Im Ergebnis dieser Studien wurden bis dato mehr als 17 
Nicht-MHC-Gene ( IDDM2 , IDDM3 , IDDM4 etc.), die auf verschiede- 
nen Chromosomen kartieren, beschrieben. Mit Ausnahme des IDDM2 
und IDDM18, bei denen das diabetogene Gen bekannt ist, sind 
bei den anderen IDDM x s die entsprechenden Gene immer noch un- 
bekannt (1,2) . 

Bei der Identif ikation dieser Nicht-MHC-Gene sind Modelltiere, 
die ahnlich dem Menschen einen Typ-1 -Diabetes entwickeln, sehr 
hilfreich. Als Modelltier fur den Typ-1 -Diabetes ist die spon- 
an diabetische BB/0 (ttawa) K(arlsburg) -Ratte ausgezeichnet ge- 
kignet, da dieses Modelltier sowohl klinisch, als auch atiopa- 
thogenetisch ein hohes MaS an Analogien zurrt menschlichen Typ- 
1-Diabetes aufweist (3-7) . Auch bei der BB/OK-Ratte sind die 
Klasse-II-Gene des MHC essentiell aber nicht ausreichend fur 
die Diabetesentwicklung. Die BB/OK-Ratte ist homozygot fur den 
MHC-Haplotyp RT1 U . Analog dem Menschen wird dieses diabetogene 
Gen als Iddml bezeichnet. Neben diesem Genkomplex ist bei der 
BB/OK-Ratte allerdings noch ein weiteres Gen, Iddm2, fur die 
Diabetesentwicklung erf orderlich. Es handelt sich dabei um ein 
Gen (1), daS eine Lymphopenie verursacht, rezessiv vererbt und 
als Iddm2 bezeichnet wird. Dafi beide diabetogenen Gene, Iddml 
und Iddm2, zwar . essentiell aber nicht ausreichend sind, wurde 
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durch verscniedene Kreuzungsstudien unter Nutzung diabetiscber 
BB/OK-Ratten und verschiedener diabetesresistenter Rattenstam- 
me belegt (8-11). Gleichgultig, ob diabetesresistente LEW.1A, 
DA, SHR Oder wilde Ratten (12) mit diabetiscben BB/OK-Ratten 
gekreuzt warden, entwickelte kein Fl-Hybrid und nur etwa 50% 
der fur beide diabetogenen Gene Iddml und Iddm2 bereits homo- 
zygoten ersten Ruckkreuzungshybriden (Rl) einen Typ-1- 
Diabetes. Der Prozentsatz von 50% an diabetischen Tieren bei 
den fur Iddml und Iddm2 bereits bomozygoten Rl-Hybriden weist 
darauf hin, daS mindestens ein weiteres diabetogenes Gen, 
Iddm3, fur die Entwicklung eines Diabetes bei BB/OK-Ratten 
twendig ist. Die genomweite Suche nach diesem dritten Gen in 
Li Kreuzungspopulationen, [(BB x DA) Fl x BB] und [(BB x SHR)F1 
x BB], zeigte, daS dieses „dritte Gen" nicht nur eia Gen ist. 
Es wurden zwei diabetogene Gene, Iddm3 und Iddm4, auf Chromo- 
som 18 bzw. 6 und ein Diabetes -protektives Gen, IddmSr, auf 
Chromosom 1 kartiert (13,14). Wanrend Iddm3 in beiden Kreu- 
zungspopulationen nachgewiesen und damit bestatigt wurde (13), 
waren Iddm4 und IddmSr nur bei [(BB x SHR) Fl x BB] Rl-Hybriden 
nachweisbar (14) . 

•Vergieicht man die homologen Bereiche zwiscben Ratte und 
Lnsch, zeigt sich, daS beim Menscben die bomologen Regionen 
fur Iddm3 auf 18q21-q23, Iddm4 auf 14q24-q32 und IddmSr auf 
llplS kartieren. Es bandelt.sich dabei urn Bereicbe, bei denen 
aucb beim Menschen die diabetogenen Gene IDDM6 auf 18q21-23 
(Iddm3), IDDM11 auf 14q24-q32 (Iddm4) und IDDM2 auf llplS 
(Iddm5r) kartiert wurden (15-17) . 

Aufgabe der vorliegenden Erfindung ist es daher zunacbst, die 
diabetogenen Gene zu identif izieren und therapeutische Ansatze 
zur Verhinderung der Typ-l-Diabetes zu formulieren. 



Im Rahmen der Erfindung wurde uberraschenderweise ein Gen 
identif iziert, das im diabetesprotektiven chromosomalen Be- 
reich liegt, dessen mutierte Varianten geeignet sind, im Rat- 
tenmodell Typ-1 -Diabetes zu verhindern. Infolge dieser Er- 
kenntnis steht damit erstmals ein wichtiger therapeutischer 
Ansatz fur Diagnose und Praventivtherapie von Typ-1 -Diabetes 
zur Verfugung. Daruber hinaus ergeben sich durch weitere, er- 
f indungsgemaS gewonnene Erkenntnisse vielfaltige zusatzliche 
Anwendungsmoglichkeiten, die naclif olgend ebenfalls beschrieben 
werden . 

^|^^a.rbeiten 

Urn zu prufen, welche Bedeutung die kartierten Iddm's der 
BB/OK-Ratte tatsachlich bei ' den* Entstehung eines Typ-1- 
Diabetes haben, wurden verschiedene kongene BB/OK-Rattenlinien 
etabliert. Kauflich erworbene, mannliche SHR/Mol -Ratten (Mol- 
legaard Breeding Ltd 7 Danemark) wurden mit diabetischen BB/OK- 
Weibchen gekreuzt. Die resultierenden Fl-Hybriden wurden auf 
diabetische BB/OK-Ratten insgesamt 7 mal ruckgekreuzt . Die 
Nachkommen jeder Ruckkreuzungsgeneration wurden auf Heterozy- 
gotie in dem interessierenden chxomosomalen mittels PCR- 
lysierter Mikrosatellitenmarker, die die interessierenden 
Bereiche flankieren, genetischen analysiert. Die fur diesen 
Bereich heterozygoten Tiere wurden dann fur die Erzeugung der 
nachsten Ruckkreuzungsgeneration angepaart. Fur den chromoso- 
mal en Bereich heterozygoten Tiere der 7 Ruckkreuzungsgenerati- 
on wurden dann untereinander (intercross) gekreuzt und erneut 
genetisch analysiert. Zunachst wurden alle Tiere, die fur den 
interessierenden chromosomalen Bereich homozygot fur Allele 
der SHR-Ratten waren, selektiert. Diese Tiere wurden dann er- 
neut mittels 13 9 PCR- analysiert er Mikrosatellitenmarker, die 
etwa 96% des Genoms. der Ratte abdecken, genetisch charakteri- 
siert. Tiere, die dann fur diese 139 Marker homozygot fur Al- 
lele der BB/OK-Ratte waren, wurden fur die Etablierung (Foun- 
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der) der kongenen Linien BB.SHR eingesetzt und phanotypisch 
charakterisiert . 

Neben den bereits beschriebenen kongenen BB. SHR-Linien (BB.1K, 
BB.Sa, BB . LL , BB . Bp2 , BB.Xs) wurden zwei weitere BB . SHR-Linien 
etabliert (18-24) . Es wurde ein Bereich von Chxomosoni 6 
(D6Ratl84 - Iddm4 - D6Rat3 , ca.15 CM) und einer von 18 (Olf - 
Iddm3 -D18Rat44, ca.24 cM) der BB/OK-Ratte durch den der SHR- 
Ratten ersetzt (24) . Die phanotypische Char akt er i s ierung die- 
ser neu etabli'erten BB-Linien, kurz als BB. 6S und BB.18S be- 
zeichnet, zeigte, daS die Diabetes inzidenz in beiden Kongenen 

•senkt werden konnte, besonders allerdings bei der kongenen 
. 6S-Linie (24). Wahrend ca. 86% aller BB/OK-Ratten einen 
Typ-1 -Diabetes bis zur 32. Lebenswoche entwickeln, erkrankten 
im gleichen Zeitraum in der neu etablierten BB.SS-Linie nur 
14% und das, obwobl die BB. 63 -Tiere homozygot fur Iddml und 
Iddm2 sind und im Restgenom der BB/OK-Ratte entsprechen, wie 
durch einen genomweite Analyse bestatigt wurde (24) . D.h. die 
Wirkunq beider essentiellen diabetocrenen Gene , Iddml und 
Iddm2, wird durch ein oder mehx Gen/e auf dem trans ferierten 
Bereich der diabetes-resistenten SHR-Ratte nahezu vollstandicr 
unterdruckt . Ein Ergebnis, welches bis dato einmalig ist. 

•eelbst bei der N (on) O (besen) D (iabetischen) -Maus , auch ein Mo- 
dell fur den Typ-1 -Diabetes, wurden diabetogene Gene kartiert 
und analog kongene NOD-Linien etabliert, urn den in vivo-Effekt 
dieser Gene zu prufen. Eine drastische Senkung der Diabetesin- 
zidenz wurde durch Austausch eines diabetogenen chromosomalen 
Bereiches wie bei BB . 63 bis dato nicht beschrieben. Eine ahn- 
lich deutliche Senkung der Diabetes inzidenz wie,b.ei BB.6S. wur- 
de nur durch Austausch von 2 und mehr chromosomalen Regionen 
der NOD durch die diabetes-resistenten Stamme erreicht 
(25-28) . 

Unterschiede zwischen BB/OK- und BB.6S-Ratten wurden auch beim 
Manif estationsalter und bei den Lymphozytenphanotypen nachge- 
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wiesen. BB . 6S -Ratten manif estieren sigxiif ikant spater (137 ± 
14 vs. 103 ± 30 Tage, p<0,001) und habeii signif ikant weniger 
aktivierte T-Lymphotzyten als BB/OK-Ratten (36,6 ± 6,9 vs. 
65,6 ± 18,4 %, p<0 7 0001) (24). Daruber hinaus werden BB.6S- 
Ratten signifikant schwerer und tiaben signifikant hohere 
Semracholesterolwerte als BB/OK-Ratten (24) . 

Da auch bei der SHR-Ratte immunologische Phinomene beschrieben 
wurden (29-31) , wurde die drastische Senkung der Diabetesinzi- 
denz von 86% bei BB/OK auf 14% bei BB.6S zunachst in der Weise 
_ interpretiert, daS in der trans ferierten Region ein SHR-Gen 
v m|er SHR-Gene lokalisiert ist/sind, dessen/deren Produkt/e die 
^l'== Jltoaggression der diabetogenen Genprodukte der BB-Ratte weit- 
gehend „neutralisieren w kann/konnen. Diese Annahme wurde durch. 
die Etablierung einer weiteren kongenen BB/OK-Rattenline un- 
terstrichen. 

Neben diabetesresistenten SHR-Ratten wurden auch Wildfangrat- 
ten zur Erzeugung von kongenen BB . K (arlsburg) W ( ild) R (atte) - 
Ratten verwendet. Analog der BB.6S-Linie wurde der gleicbe 
chromosomale Bereich der BB/OK von 15 cM durch. den von Wild- 
fangtieren ausgetauscht (BB.6W). Die Erkrankungshauf igkeit in 

•dieser kongenen BB.6W-Linie ist mit der der BB/OK-Ratte ver- 
gleichbar (89% vs. 86%, 32). Daher wird erf indungsgemafi davon 
ausgegangen, daS die Diabetes- Pro tekt ion bei BB. S3 das Ergeb- 
nis* einer „ neutral is ierenden" Genwirkung der SHR-Ratte und 
nicht dem Ersatz von Iddm4 der BB/OK-Ratte anzulasten ist. 

Die Identif ikation der/des Gene/s war somit angezeigt, denn 
mit der Identif ikation des/der Gens/Gene ist die Moglichkeit 
verbunden, eine genspezif ische Behandlung und/oder Prevention 
des Typ-1 -Diabetes bzw. von Autoiramunerkrankungen per se vor- 
nehmen zu konnen. 
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Fortfuhrende Arbeiten zur Identif ikati on des/der diabetespro- 
fcektiven Gens /Gene 

Nach der Entschlusselung des menschlichen Genoms (ca. 40.000 
Gene) geht man tieute davon aus, daB etwa 15-20 Gene pro cM und 
nicht wie bisher angenommen 50 Gene lokalisiert sind. Ausge- 
hend von dieser Annahme sollten in dem trans ferierten chromo- 
somalen Bereich der BB.6S-Ratte von ca. 15 cM etwa 225-300 Ge- 
ne kartieren. Angesichts dieser Zahl ist die Identif ikation 
von moglichen Kandidatengenen fur eine Diabetesprotektion ein 
aussichtsloses Unterfangen, weshalb subkongene BB . 6 S -Ratten 
:zeugt wurden, urn den chromosomal en Bereich mit der diabete- 
rotektiven Wirkung weiterhin einzugrenzen. 

BB.6S-Ratten wurden mit diabetischen BB/OK-Ratten gekreuzt. 
Die result ierenden Fl-Hybriden fur den Bereich auf Chromosom 6 
wurden untereinander gepaart (intercross) und genet isch analy- 
siert, wobei das Markerspekrum er-weitert wurde, um moglichst 
Rekombinationen in kleinen Bereiche erkennen zu konnen: 
D6Rat3 -D6Ratl-D6woxl3 -D6Ratl01- Ighe/Ckb-D6Mgh2 -D6Rat94- 
D6Ratl83-D6Ratl0-D6Rat7-D6Rat75-D6Rat9-D6Rat6-D6Ratl60-D6Mgh9- 

D6Ratl84 . 



ie Zuordnung der Linien mit Diabetesprotektion erfolgte nach 
der Erkrankungshaufigkeit. Erkrankten bereits mehr als 50% der 
Nachkommen einer subkongenen Linie vor dem 100. Lebenstag, 
sprach dieser Phanotyp fur den der BB/OK-Ratte und die Linie 
wurde eliminiert. Erkrankten weniger als 15% bis zum 100. Le- 
benstag, zeigte diese Linie den Phanotyp von BB . 6S . Diese Li- 
nien wurden fur die Weiterzucht zwecks Minimierung der Diabe- 
tes -protektiven Region eingesetzt. Durch die Etablierung ver- 
schiedener subkongener Linien (BB.6Sa,b,c. . ) mit dem Phanotyp 
der BB.6S-Ratte, wurde der in Frage kommende chromosomale Be- 
reich auf < 2 cM ( 30-40 Gene) eingegrenzt. 
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Wie nachfolgend dargestellt, kartiert das diabetesprotektive 
Gen urn den Locus D6Mgh2 . 

Tabelle 1: 
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Der Locus D6Mgh2 ist ein Mikrosatellit im Efl-Gen. Efl ist ein 
Pseudogen und kartiert beim Menschen auf Chromosom 14q32 und 
bei der Maus auf Chromosom 12ql4 . Nach Angaben der Chromoso- 
menkarte von Watanabe et al. (1) soli auf Chromosom 6q32 der 
Ratte auch das Gen Macs kartieren (httr> ; / /ratmap . ims . u- 



tokyo.ac . jp) . Dieses Gen ist aber beim Menschen auf Chromosom 
6q21-6q22.2 und nicht auf 14q32 lokalisiert worden. Falls dies 
zutreffen wiirde, bedeutet es, da£ 6q32 der Ratte sowohl homo- 
log zum humanen Chromosom 14q32, als auch 6q21-6q22.2 sein 
kann. Zwecks Kandidatengensuche war es notwendig, abzuklaren, 
ob Macs tatsachlich auf dem Rattenchromosom 6q32 kartiert. 
Durch einen Polymorphisms im Macs-Gen (zwischen 901 und 1321, 
KWR hat 1 Aminosaure mehr) zwischen BB/OK und Wildf angtieren 
(KWR) wurden die Sequenzen zwischen BB/OK, KWR und BB.KWR 
(Chr. 6; BB.6W) verglichen. Alle BB.6W-Tiere zeigten den Geno- 
typ der BB/OK-Ratte. Dadurch konnte ausgeschlossen werden, da£ 
cs auf Chromosom 6q32 der Ratte lokalisiert ist und damit 
n Kartierungsfehler vorliegt. Dadurch konnte die Kandidaten- . 
gensuche durch Homologievergleiche auf 12ql3 der Maus und 
14q32 des Menschen beschrankt werden. 

Da im diabetesprotektivem Bereich auch das Gen Aktl/Pkb kar- 
tiert, welches essentiell fur die S-Zellfunktion ist (2-4) , 
wurde zunachst versucht, Aktl/Pkb relativ genau in der Region 
zu positionieren. Da BB/OK und SHR polymorph sind (Intron zwi- 
schen 1321 und 1561), konnte mit Hilfe der subkongenen BB.6S- 
Linien Aktl/PKB zwischen Ighe und Ckb, also auSerhalb der dia- 
etesprotektiven Region, kartiert werden. Damit .schied dieses 
Gen als moglicher Kandidat aus. 

Durch die parallel laufende in vivo-Charakterisierung der 
BB.6S-Ratten im Vergleich zum Parentalstamm BB/OK wurden wei- 
tere Erkenntnisse zur Funktion des moglichen Kandidatengens 
gewonnen : 

1. Morphologische Untersuchungen des Pankreas von normoglyka- 
mischen BB/OK- und BB.SS-Ratten zeigten signifikante Unter- 
schiede auf. Im Alter von 30 Tagen waren bei BB.6S signifi- 
kant mehr Langerhanssche Inseln mit Lymphozyten infiltriert 
(Insulitis) als bei BB/OK. Bei jeweils 12 untersuchten 
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BB.6S bzw. BB/OK waren 51,2 ± 4,6% bzw. 7,5 ± 2,5 % 
(p<0,001) der Inseln infiltriert. Im Alter von 90 Tagen war 
der Pro z exits at z an Inseln mit Insulitis zwischen be i den 
Stammen vergleichbar und lag bei etwa 50%. Demnach tritt 
sowohl bei BB/OK als auch bei BB.6S eine Insulitis auf, die 
bei BB/OK bei etwa 86% der Tiere und bei BB.6S nur bei etwa 
14% zur Zerstorung der Beta-Zellen und damit zum Typ-1- 
Diabetes fuhrt, was fur die Induktion • einer Iramuntoleranz 
bei BB.6S sprechen konnte. 

Signifikante Unterschiede fanden sich auch zwischen frisch- 
manif estierten, diabetischen BB/OK und BB.6S im Insulinge- 
halt und 'Prozentsatz Insulin-positiver S-Zellen. Ira Ver- 
gleich zu diabetischen BB/OK war der Insulingehalt (0,15 ± 
0,03 vs. 0,42 ± 0.13 pmol/mg, p<0,05) und der Prozentsatz 
Insulin-positiver fi-Zellen (0,07 ± 0,02 vs. 0,19 ± 0,06%, 
p<0,05) signifikant niedriger als bei diabetischen BB.6S, 
was da fur sprechen konnte, daS die Zerstorung der Insulin- 
produzierenden £-Zellen nicht so aggress iv wie bei BB/OK- 
Ratten ablauft (37) . 

Untersuchungen zur Frakturheilung bei BB/OK- und diabetes - 
resistenten LEW. 1W- Rat ten (38) zeigten, daS der Knochen der 
BB/OK-Ratte deutlich bruchiger als der von LEW. lW-Ratten 
war, was auf eine mogliche Storung im Calcium- Stoffwechsel 
der BB/OK hinwies . Verschiedene Untersuchungen zum Calcium- 
Stoffwechsel ergaben allein signifikante Unterschiede im 
Serumcalcitoningehalt zwischen BB/OK und BB . 6S -Ratten. Si- 
gnifikant hohere Calcitonwerte wurden bei . BB/OK als bei 
BB.6S nachgewiesen (2,4 ± 1,57 vs. 1,0 ± 0,65 pmol/ml; 
p=0,0002). Da ^ Calcitonin nicht nur die Calcium- Freisetzung 
des Knochens hemmt, sondern ebenso liber verschiedene Protei- 
ne und Rezeptoren die Insulinsekretion hemmen kann (39,40), 
wurde versucht, durch Modulation der Calcium-Zufuhr uber die 
Nahrung von BB/OK und BB.6S einen weiteren Hinweis zum Zu- 
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sammenspiel von Calcium (Ca) und Diabetesmanif estation zu 
erhalten. 

BB/OK und BB.6S-Ratten wurden mit Standarddiat (0,8% Ca) , 
mit Ca-reicher (2%) und Ca-armer Diat (0,4%) ernahrt und bis 
zur 30. Lebenswoche auf Diabetesentwicklung beobachtet. Wah- 
rend bei BB/OK-Ratten kein Einf lu£ der Diat auf die Erkran- 
kungshaufigkeit nachweisbar war (Kontrolle=88%; Ca-arm=92%; 
Ca-reich=90%) , erkrankten bei BB.GS-Ratten signifikant mehx 
Tiere an einem Diabetes, wenn sie mit Ca-reicher Diat er- 
nahrt wurden (Kontrolle=12% ; Ca-arm=18%; Ca-reich= 45%, 
p=0.02). Daruber hinaus fiihrte die Ca-reiche Emahrung zur 
Angleichung der Korpermasse und des Serumcholsterolgehaltes 
bei BB/OK und BB.6S. Signifikante Unterschiede zwischen bei- 
den Linien traten bis zur 30. Lebenswoche nicht auf. Weitere 
in vivo - Manipul a t i onen , wie Verabreichung von Ca-Kanal- 
Blockem oder verscliiedenen Ca- Antagonist en, ergab keinerlei 
in vivo-Ef f ekte . 

In vitro Untersuchungen an isolierten Langerhansschen In- 
seln von BB/OK- und BB.6S- Ratten zeigten, daS durcli Varia- 
tion der Ca-Konzentration im Kulturmedium weder der Insulin- 
gehalt, noch die glukosestimulierte Insulinsekretion zwi- 
schen beiden Linien differierte. 

Signifikante Unterschiede fanden sich jedoch bei der Protei- 
nexpression mittels Westernblottanalyse . Das Ca-bindende 
Protein, Calbindin-D28k, war in Ins e In von BB.SS-Ratten be- 
reits unter Basalbedingungen doppelt so hoch. wie das von 
BB/OK-Ratten. Zunehmende Ca-Konzentration im Medium erhohte 
deutlich die Proteinexpression von Calbindin-D28k bei BB.6S- 
Inseln wahrend die Expression bei BB/OK-Ratten durch Ca fast 
unbeeinfluSt blieb. Calbindin-D28k ist ein cytosolisches Ca- 
bindendes Protein, welches bevorzugt in der Niere, aber auch 
im Pankreas und Gehim exprimiert wird und den apoptotischen 
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(gengesteuerten) Zelltod verliindern kann (41,42). Funktional 
wird vermutet; da£ Calbindin-D28k bei der Regulation der Ca- 
Reabsorption beteiligt ist. 




Da das Kandidatengen 

1. die zwei essentiellen diabetogenexi Gene, Iddml und*Iddm2, 
* nahezu ausschalten kann, 

2 . bei der Immuntoleranz und beim apoptotischen Zelltod, 

als auch bei der Regulation von Ca, Ca-bindenden Proteinen 
(Calbindin-D28k u.a. ) und Hormonen (Calcitonin, u.a.), 

4. bei der Entstehung einer Dyslipidamie involviert ist, 

wurde der SchluS gezogen, daS das Gen ein multifunktioneller 
Transkri ptioiisfaktor ist. 

Das Kandidatengen 



fach Homologievergleichen und Genfunktionsprufungen wurde der 
anskriptionsfaktor Yin Yang-1 (YY1) , der tnit hoher Wahr- 
scheinlichkeit in der diabetesprotektiven Region bei Mensch 
und Maus kartiert, im Rahmen der vorliegenden Erfindung als 
Kandidatengen favorisiert, denn er kann die Transkription ei- 
ner groSen Anzahl von zellularen und viralen Genen aktivieren, 
aber auch. hemmen bzw. kann selbst Transkription initiieren und 
entspricht damit einem raultifunktioneriem Transkriptionsf ak- 
tor . 



YY1 gehort zu der Klasse der regulatorischen Transkriptions- 
faktoren (RTF), d.h. die Bindung erfolgt sequenzspezif isch an 
proximale und distale Regulationselemente der DNA. Daruber 
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hinaus besitzt er die Fahigkeit, direkt oder indirekt einen 
EinfluS auf die Transkriptionmaschinerie zu nehmen. Durch sei- 
nen vielseitigen molekularen Strukturaufbau (Aktivierungsdoma- 
ne, Repressionsdomane, Zinkf ingerstrukturen) ist es ihm mog- 
lich, eine dif f erentielle Genaktivitat durchzu.fuh.ren. Das 
heiEt, er kann als zeitlicher, raumlicher, zeUspezif ischer , 
organspezif ischer oder signalvermittelnder Parameter fungie- 
ren. Seine Funktionsmodiile erfiillen die Aufgaben der spezifi- 
schen DNA-Erkennung, der Transkriptionsaktivierung, Transkrip- 
tionsrepression, aber auch die Interaktion mit anderen Protei- 
nen. 

^^^naufbau - Vergleich 

Das Protein von Yin Yang ist gekennzeichnet durch die lokale 
Anhaufung von Aspraginsaure (D) und Glutaminsaure (E) zwischen 
den AS-bereichen 43 bis 53. Der Abschnitt ist homolog zw. Rat- 
te und Mensch, jedoch unterscheidet sich die Anzahl und die 
Position von E und D voneinander. Die Ratte besitzt 5 x E und 
6 x D, wobei der Mensch uber 6 x E und 5 x D verfiigt. Daran 
schlieiSt sich. ein Histidin-Cluster bei der Ratte von 54 bis 79 
und beim Menschen von 54 bis 82 an. Es fehlen 3 Histidine bei 

•der Ratte gegenuber der humanen Seqeuenz . Es folgt eine GA/GK 
reiche Domane von 154 bis 198 beim Menschen. Bei der Ratte ist 
dieser Positionsbereich um 3 AS-Positionen in Richtung N- ter- 
minales Ende versetzt. (151-195). Die vier Zinkfinger der hu- 
manen Sequenz beginnen an Position 2 98 und enden an Position 
407. In der Rattensequenz erstreckt sich dieser Bereich von 
295 bis 404. Die gesamte AS-Lange betragt beim Menschen 414 
und bei der Ratte 411 AS (s. Sequenzprotokoll : SEQ ID NO: 2 und 
4; die Bezeichnung "SEQ ID NO:" entspricht hier und im folgen- 
den der Sequenzkennzahl "<4 0 0> ,T nach WIPO Standard ST. 25) . 



14 



Funktionelle Domanen 

Viele Forschergruppen haben die Struktur und Funktion von YY1 
mit Hilfe von Deletionsmutantan, sowie mit Reporterkonstmkten 
analysiert. Diese Ergebnisse sind in Fig. 1 zusammengef aSt . 

Ubereinstimmend wurden zwei Aktivierungsdomanen gefunden. Sie 
sind im Bereich des N-terminalen Endes und in der Region des 
Zinkf ingers lokalisiert. Daruber hinaus konn'ten von zwei Grup- 
pen weitere Domanen mit aktivierender Funktion in der Nahe des 
^■^Terminus lokalisiert werden (397-414 und 370-397) (43,44). 
■ .LjfBn argumentierte die Maskierung der N-terminalen Aktivie- 
^^ungsdomane durch die C-terminale Domane, sowie daS bei Dele- 
tion der C-terminalen Domane die N-terminale Domane demaskiert 
wird, so daS YY1 als konstitutiver Aktivator agieren kann. 
Diese Ergebnisse fuhrten zu dem SchluB, daS nur unter bestimm- 
ten Bedingungen YY1 zum Aktivator wird. Es zeigte sich., daS 
das E1A in der Lage war, Yin Yang in einen Aktivator umzuwan- 
deln (43) . 

Repres s ionsdomanen konnten fur den Zinkf ingerbereich lokali- 

•siert werden. Dabei werden dem Zinkf inger 1 und 2 die Repres - 
sionsaktivitat zugesprochen, wobei Zinkfinger 2 und 3 fur die 
DNA-Bindung zustandig sein sollen (45). Bei Betrachtung der 
Rontgen-Cokristallstruktur von Zinkfinger 2 und 3 stellte man 
im Gegensatz dazu fest, da£ diese in der Lage waren, an den 
Basen, sowie an das Phosphatriickgrat der DNA anzugreifen (46) . 
Fur den Zinkfinger 1 konnteri Kontaktstellen nur fur das Phos- 
phatruckgrat und fur Zinkfinger 4 nur fur einige wenige Basen 
gezeigt werden. 

Weitere Repress ionsdomanen zeigten sich uberlappend mit der 
Akti vie rungs domane an den Positionen von 1 bis 201, sowie von 
170 bis 200 (47,48) . 
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Die Interpretation ciieser Ergebnisse von Thomas et al. (49) 
zeigten zusanvmenf assend, dafi sich. nur zwei Repress ionsdomanen 
im YY1 Gen befinden, im Bereich von 170 bis 200 und in der 
Zinkfinger region, die vielleicht zusammen interagieren konnen 
(vgl . Fig. 1) . 

Protein/Protein Interaktionen 

Yin Yang ist imstande, mit Proteinen, wie Transkriptionsf akto- 
M und Coaktivatoren/Corepressoren zu interagieren. Zwei Do- 

^Mjjfcien, die interagieren sind die Bereiche urn 150 bis 170 (zen- 

trale Domane) , in denen die GA/GK reiche Domane^ mit Teilstuk- 

ken des Spacers, sowie die C-terminale Region und die Zinkfin- 

ger mit Teilen des Spacers lokalisiert sind. 

Einige Proteine, wie TBP, CBP/p300, TFIIB, E1A und c-MYC kon- 
nen an beide Regionen binden (43,45,47,50,51). Proteine, die 
nur mit einer dieser zwei Domanen interagieren konnen, sind: 
HDAC2 (zentrale Domane), SP1 und ATF/CREB (C-terminale Domane) 
_ (45,48,52-54) (vgl. Fig. 2). 

^§Ralvin and Shi demonstrierten (45), daS die Repression von 
-^CREB und SP1 durch YY1 aktivator-spezif isch. ist. Die Autoren 
prostulierten, daS YY1 die Target (s) der Aktivatoren interfe- 
riert, anstelle von direkter Bindung zu diesen zwei Faktoren. 

Nur ein Protein, E1A, wurde bisher gefunden, welches direkt 
mit der Aktivierungsdomane von YY1 interagiert (43,47,55). 
Seit dieser Entdeckung wird diskutiert, ob YY1 seine Repres- 
sorfunktion in Riclitung Aktivator auch verandern kann, mogli- 
cherweise durch Maskierung seiner Repress ionsdomanen liber Mo- 
difizierung, oder aber liber Freilegung seiner Aktivierungsdo- 
mane. 
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Promo t o rb indung 

Ausgezeichnet durch. vier Cys2-His2-Zinkf inger ist Yin Yang in 
der Lage, entweder die Transkription zu aktivieren oder zu in- 
hibieren, was jedoch von der Promotorseguenz der Gene und von 
der Konzentration des YY abhangig ist. Die Consensus -Sequenz 
(C/t/a) CATN(T/a) (T/g/c) , die in vielen Promotoren von viralen 
und zellularen Genen zu finden ist, kann liber den Zinkfinger 
gebunden werden (56) . 
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pre s s ionsmode lie 

feben der geregelten Aktivierung der Transkription stellt auch 
dessen Repression einen wichtigen Kontrollmechanismus der Gen- 
aktivitat dar. Repression durch Umkehrung bzw. Aufhebung gen- 
aktivierender Prozesse kann durch YY1 bewirkt werden. Im YY1- 
Genabschnitt wurden mehrere Repress ionsbereiche gefunden (sie- 
he Fig. 3) . 

Drei Modelle der Repressoraktivitat sind bis zum heutigen 
Stand bekannt. Im ersten Modell deplaziert YY1 den Aktivator. 
Storende Eigenschaf ten weist er im zweiten Modell auf . Er be- 
indert den Aktivator, sowie die generellen Transkriptionsf ak- 
oren (GTF) in der Ausubung ihrer Funk t ion. 



Eine indirekte Repression (Drittes Modell) fulirt YY1 uber die 
Rekrutierung von Corepressoren aus. Er nimmt indirekten Ein- 
fluS auf die Chr omat ins t ruktur (49) . Von besonderem Interesse 
sind dabei die HDAC 1,- 2 und 3, als Corepressoren. HDAC's ste- 
lien im Zusammenliang mit Auflockerung der Chromat ins t ruktur . 
Alle drei Proteine sind globale Regulatoren der RPD3 , d.h. sie 
sind in der Lage, Histone zu deacetylieren (in vitro) . AuEer- 
dem konnen die HDAC bei Dirigation zum Promotor direkt die 
Transkription blockieren (48, 57-60) . Bei Dberexpression von 
HDAC 2 konnte durch die Gruppe Yang et al . (48) gezeigt wer- 
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den, daS die Repressionsfunktion von YY1 verstarkt wird. Durch 
die Entdeckung, daS HDAC 2 im Komplex mit HDAC 1 arbeitet, muE 
das gleiche auch fur HDAC 1 gelten. 

Akt i vi erung smode lie 

Drei Modelle sind bekannt, wie Yin Yang die Transkription ak- 
tiviert (siehe Fig. 4) . -Direkte Aktivierung konnte mit Hilfe 
des Adenovirus Protein El A von der Gruppe Shi et al (61) ge- 
zeigt werden. Stimulation der Transkription wird erreicht 

•rch die direkte Interaktion YY1 mit den GTF: TAFII55, TBP 
& TFIIB (62,63). Der zweite Mechanismus konnte am AAV P5 In- 
itiator Element aufgeklart werden (64) . Daruber hinaus wird 
diskutiert, ob YY1 eine strukturelle Veranderung durchmacht, 
wenn er mit anderen Proteinen interagiert . Im dritten Modell 
rekrutiert Yin Yang Coaktivatoren, die mit anderen Transkrip- 
tionsfaktoren interagieren. Dieses Modell beinhaltet viel- 
leicht auch die Modifikation des Chromatin durch p300. Durch 
die Auflockerung der Chromatinstraktiir mittels p300 (HAT- 
Aktivitat) , ware der Zugang zur DNA erleichtert und eine ef f i- 
ziente Bindung moglich (51,55,65). 

.^j^^legulation von YY1 durch Acetyl ierung und Deacetylierung: 

Die Regulation des Transkriptionsf aktors erfolgt auf der post- 
translationalen Ebene durch die Interaktion mit anderen Pro- 
teinen. 

Die Transkriptionsaktivatoraktivitat von YY1 ist direkt abhan- 
gig von der Assoziation zu den Coaktivatoren p300, CBP, sowie 
PCAF. Diese Coaktivatoren besitzen Histon-Acetyltransf erase 
(HAT) und sind somit befahigt, Acetylgruppen zu trans ferieren. 
Im Gegensatz dazu ist die Repressionsaktivitat von YY1 assozi- 
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iert mit der Histon-Deacetylase2 (HDAC2) im Bereich 170-200 
der Repress ionsdomane . 

Die selektive Assoziation von YY1 mit HAT oder HDAC entschei- 
det dartiber, ob er als Aktivator oder Repressor fungiert. 

Acetylierung und Deacetylierung durch p300,PCAF und DHAC: 

Yin Yang verfugt uber 2 Acetylierungsdomanen. Die erste liegt 
im Bereich zwischen 17 0 bis 200, die Zweite uberlappt den 
Z inkf ingerbereich am C- terminal en Ende zwischen 261-414 . 

^g^^e Acetylierungen im Bereich 17 0 bis 200 werden durch p3 00 
und PCAF an den Lysin- Resten durchgefuhrt . Sechs Paare an 
Lysinen befinden sich in der ersten Domane, wobei aber nur 3 
verschiedene Lysine durch p3 00 und PCAF acetyliert werden. Um 
eine maximale Repressionsaktivitat zu erhalten, muS YY1 an al- 
ien drei Stellen acetyliert werden. Wiirde nur ein Lysin durch 
ein Arginin ersetzt werden, ware keine maximale Repressionsak- 
tivitat mehr gewahrleistet , aufgrund der eintretenden Konfor- 
mationsveranderung . 

•Ein weiterer, entscheidender Punkt der Acetylierung zwischen 
IL70 bis 200 ist, dafi sich die Bindungswahrscheinlichkeit von 
DHAC signifikant erhoht und somit in diesem Bereich auch eine 
Deacetylierung durch HDAC 1,2 erfolgen kann. 

Erstaunlicherweise ist es HDAC auch moglich, in dem zweiten 
Acetylierungsbereich (261-333) zu binden. Im Gegensatz zur er- 
sten Acetyl ierungsdomane findet hier jedoch keine Deacetylie- 
rung statt. 

Weiterhin konnte gezeigt werden, daS sich durch die Acetylie- 
rung von PCAF im uberlappenden Bereich des Zinkf ingers. (261- 
333) die DNA-Bindungsaktivitat von YY1 erniedrigt (66) . 
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Feinkartierung von YY1 

Da die Sequenz der Ratte nicht in der Genbank vorhanden ist, 
wurde erf indungsgemafi die Gensequenz der Maus benutzt, urn Pri- 
mer zu rekrutieren, denn die erste Aufgabe bestand in der 
Feinkartierung von YY1. Es mufite sichergestellt werden, daS 
das Gen tatsachlich im diabetesprotektiven Bereich liegt. 

Da die Chance, im Intron einen Po lymorphi smus zu finden, recht 
grofi ist, wurden Primer zur Amplif ikation der Introns verwen- 

•|t (vgl. Fig. 11; Intron 1: K828-F/K829-R; Intron 2: K830- 
Fk832-R; Intron 3: K831-F/K833-R; Intron 4: K815-F/K817-R; 
K815-F/K875; K821-F/K817-R; K821-F/K870-R; K874-F/K87 0-R) . Es 
wurde nur ein sequenz ierbares Genprodukt mit genomischer DNA 
vom Intron 4 erhalten. Das Intron hat 633 Basenpaare (bp) und 
unterscheidet sich zwischen BB- und SHR-Ratten an den Positio- 
nen 323 (t-a) , 502 (g-c) und 528 (a-c) . Zur genauen Positio- 
nierung von YY1 auf Chromosom 6q32 wurde dieser Polymorphisms 
uxiter Verwendung der subkongenen BB . 6S-Linien benutzt. YY1 
wurde zwischen D6Mgh2 und Ighe kartiert und befindet sich so- 
mit im diabetesprotektiven Bereich, 

•pm zu prufen, ob der Po lymorphi smus im Intron 4 auch bei an- 
deren Stammen vorkommt oder weitere Unterschiede auftreten 
konnen, wurde das Intron 4 von folgenden Ratten sequenziert 
und verglichen: 2 Wildf angtiere (Wildtyp, M+W) , jeweils 1 Tier 
von diabetes -res is tent en, ingezuchteten DA/K, BN/Mol , LEW/K 
und WOKW-Ratten. 

WOKW-Ratten entwickeln keine Hyperglykamie (=Diabetes) , aber 
ein komplettes metabolisches Syndrom (Fettsucht, Hyperinsu- 
linamie, Dyslipidamie, gestorte Glukosetoleranz, Hypertonie) 
und stammen wie BB/OK-Ratten aus der gleichen Wistarratten- 
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Auszuchtpopulation der BioBreeciing Laboratories, Ottawa, Carta - 
da (67,68) . 

Im Ergebnis zeigte sich, daS die Intronsequenz zwischen BB/OK 
•and Wildfangtieren, sowie zwischen SHR und DA, BN, LEW.1W, als 
auch WOKW identisch ist. 

Secjuenzierung von YY1 

Zur Sequenzierung des Gens wurde genomische DNA aus Lebergewe- 
be (Wizard ®, Genomic DNA Purification Kit, Promega) und mRNA 

•s isolierten Langerhansschen Inseln, Pankreas, Leber und Ge- 
m der BB/OK- , SHR- und BB.6S-Ratte gewonnen (Rneasy Mini 
Kit, Qiagen) . RNA wurde darm in ssDNA bzw. cDNA nach Angaben 
des Herstellers umgeschrieben (Reverse Transcription System, 
Promega) . Sowohl genomische als auch. cDNA wurde mittels PCR 
(Einsatz von GeneAmp® High Fidelity PCR System, Applied Bio- 
Biosys terns) unter Verwendung verschiedener Primer so amplif i- 
ziert, daS uberlappende Genprodukte zur Sequenzierung zur Ver- 
fugung standen (vgl. Fig. 11; Promotor: K823 -F/K825-R* ; Promo- 
tor und Exon 1: K884-F/K806-R; Exon 1: K801-F/K804-R; K814- 
F/KK832-R*; Exon 2 und 3: K828-F/K833 -R; K831-F/K817-R; Exon 

•| : K815-F/K870-R; K815-F/K818-R; K816-F/K819-R; K834-F/K836- 
l) . Die PCR wurde wie folgt durchgef uhrt : 3 min 94°C, gefolgt 
von 35 Zyklen a 30 sec 94°C, 1 min 55 oder 60°C (*) , 45 sec 
72°C mit anschlieSender Elongation von 3 min bei 72°C. 

Die amplif izierten Genprodukte wurden nach Reinigung mit Ami- 
con®Microcon-PCR-Zentrifalfiltern (Millipore, USA) fur die Se- 
quenzier-PCR verwandt. Die gereinigten PCR-Produkte (250 ng) 
wurden unter Verwendung von ABI PRISM® BigDye Terminators 
v3.0 Cycle Sequenzing Kit nach Vorschrift des Herstellers 
(Applied BioBiosystems) amplif iziert (25 Zyklen: 10 sec. 96°C, 
4 min 60°C) . Die amplif izierten Genprodukte wurden anschlieSend 
mit Alkohol gefallt, getrocknet, in Formamid (4 /xl) und Loa- 
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ding Buffer aufgenommen, 2 min bei 90°C denaturiert und 

danach mit dem ABI PRISM® 377 (Applied BioBiosys terns) sequen- 
ziert. Die Sequenzauswertung, einschlieSlich der Erstellung 
der Proteinsequenz erfolgte mit der Sequenzanalysesystemsof t- 
ware v3.4.1 (Applied BioBiosystems) . Die Genprodukte wurden 
wiederholt sequenziert und analysiert, um Artefakte ausschlie- 
Sen zu konnen. 

Das YYl-Gen der Ratte umfafit 1236 Basenpaare (bp) und besteht 
aus 411 Aminosauren (AS) . Sequenzunterschiede zwischen BB/OK 
und SHR bzw. BB . 6S wurden an Position 603 (c-t) , 980 (t-g) und 

•04 (g-a) nachgewiesen (vgl. SEQ ID N0:1 und 3). Dieser Ba- 
naustausch fuhrt zur Anderung der Aminosauren an Position 
303 und 311 im Zinkf ingerbereich (vgl, SEQ ID NO: 2 und 4). Bei 
BB/OK-Ratten kodieren die AS Methionin (Nukleotide 907-910 ab 
Startcodon) und Arginin (Nukleotide 931-933 ab Startcodon) und 
bei SHR- Rat ten die AS Arginin und Lysin. 

Der Promotorbereich wurde nur teilweise vom Transkriptions- 
start (-72) sequenziert, wobei noch ein Bereich von 47 0 bp mit 
der GC-Box vorliegt. Unterschiede zwischen BB/OK und SHR waren 
nicht nachweisbar. 

•pach Sequenzvergleichen mit der Maus sollte der Promotorbe- 
reich ca. 891 bp vom Transkript ions start entfernt sein (Acc: 
L13969, 1-464, 86% Homologie) . Beim Vergleich mit der Humanse- 
quenz (Acc: AF047455 Promotor in dieser Sequenz nur -42bp) wa- 
ren Ubereinstimmungen zwischen -636 bis -585 (216-269; 47/54; 
87% Ubereinstimmung) und -464 bis -392 (392-464; 64/73; 87.%) 
Basen vom Transkript ions start zu finden. 
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Sequenzvergleich der Nukleinsaure und des Proteins zwischen 
Ratte und Mensch 

Der Sequenzvergleich zwischen BB/OK-, SHR-Ratte und Mensch, 
wie in Fig. 9 und 10 zusammengestellt , zeigten eine bp- 
Ubereinstitnmung von 95,6% bzw. 95,3% und die AS von 96,9 bzw. 
96,4%. Berucksichtigt man die Tatsache, daS der Ratte 3 AS 
fehlen (3 Histidine, 1 x zwischen Aktivierungs- und erster Re- 
press s ions domane, Position 66 beim Menschen und 2 in der er- 
sten Repressionsdomane, statt 12 Histidinen hat die Ratte nur 
10) , erhoht sich die Ubereinstimmung im codierenden Bereich 

•ischen Ratte und Mensch bei den bp auf 97,0 (1206/1239) bzw. 
\ 8% (1200/1239) und bei den AS auf 97,6% (401/411) bzw. 
97,1% (399/411). Im Zinkfinger, der 330 bp und 110 AS umfafit, 
stimmen bei der BB/OK-Ratte 99% der bp (327/330) und AS 
(109/110) und bei SHR-Ratten 98% der bp (325/330) und 97,3% 
(107/110) der AS uberein. 



Genexpr e s s i ons s t udi en 
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Um zu prufen, inwieweit die Sequenzunterschiede eine Auswir- 
kung auf die Genexpr e s s i on von YY1 haben, warden Genexpressi- 
•nsstudien durchgefuhrt . 



s wurde mRNA aus isolierten Langerhannschen Inseln, Pankreas, 
Leber, Gehirn, Thymus und Milz von 8 Tage alten Ratten der In- 
zuchtstamme BB/OK, SHR, BB. 6S und LEW („uhbelastete w Kontrol- 
le) gewonnen und in ssDNA umgeschrieben. Die optimalen PCR- 
Bedingungen wurden -fur jedes Primerpaar unter Verwendung von 
ssDNA diabetesresistenter LEW-Ratten erarbeitet. Als Kontroll- 
situation (housekeeping gene) wurde die Genexpression von 
GAPDH zugrunde gelegt . Gewebsspezif ische cDNA wurde mit den 
Primern fur GAPDH (Forward: 5 * TCCCTCAAGATTGTCAGCAA3 x ; Rever- 
se: 5 x AGATCCACAAACGGATACATT3 * , ProduktgroSe = 3 08bp) und den 
YYl-Primern K801-F/KK804-R (Exon 1) und K831-F/K8818-R bzw. 
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K831-F/K870-R (Zinkf inger) amplif iziert . Die. Genprodukte wur- 
den gelelektrophoretisch auf getrennt und die Expresionsstarke 
zwischen den Stammen unter Berticksichtigung von GAPDH und Nut- 
zung des Typhoon 8600 Variable Mode Imager (Mersham-Pharmacia 
Biotech, U.K.) quantif iziert . 

Es wurde wiederholt gezeigt, daS der YY1 - Zinkf ingerbereich un- 
ter Verwendung der Primer K831-F/K8818-R und K831-F/K870-R in 
isolierten Langerhansschen Inseln der BB/OK-Ratte bzw. LEW- 
Ratte stark (YYl-Zinkf inger /GPDH-Intensi tat = 0.19 ± 0.04) und 
signifikant erniedrigt in den von SHR- und BB.6S-Ratten expri- 

•ert ist (YYl-Zinkf inger /GPDH-Intensi tat = 0.03 ± 0.02; 
0.001). Im Pankreas zeigte sich ein ahnlicher Expressionsun- 
terschied, jedoch etwas abgeschwacht . Die Untersuchung der Ex- 
pression unter Verwendung der Primer K831-F und K870-R zeigte, 
dafi im Pankreas, der Leber und im Gehirn bei BB.SS-Ratten eine 
zweite, um ca. 150 bp kiirzere Bande auftrat, die weder bei 
BB/OK noch bei SHR und LEW zu beobachten war. Interessant war 
auch die Tats ache, daS Geschlechtsuaterschiede in der Genex- 
pression auftraten. Die Expression bei mannlichen Tieren war 
stets starker als bei Weibchen. In alien anderen untersuchten 
Organen wird YY1 exprimiert. Augenfallige Unterschiede zwi- 

•chen den Stammen, auSer zwischen mannlichen und we ib lichen 
ieren, wurden nicht beobachtet. 

Sequenzierung der zweiten Bande bei BB,6S 

Da eine zweite Bande nur bei BB.6S -Ratten im Pankreas, in der 
Leber und im Gehirn auftrat, wurde diese zweite Bande eluiert 
(Wizard®PCR Preps DNA Purification System, Promega) , amplif i- 
ziert und sequenziert. Im Ergebnis zeigte sich, daS diese Ban- 
de eine verkiirzte Zinkf ingersequenz ist (vgl. Fig. 12 und SEQ 
ID NO: 7) . Danach fehlt ein Teil vom Zinkf inger 1, und Zinkf in- 
ger 2 fehlt vollstandig (967 bis 1125; vgl. SEQ ID NO:8). 
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SchluEfolgerungen 

Da gezeigt werden konnte, daS 

1. YY1 als multifunktioneller Transkriptionsf aktor im diabete- 
sprotektivem Bereich kartiert, 

2 . Sequenzunterschiede mit Anderung der AS zwischen BB/OK land 
SHR im Zinkf ingerbereich (AS an Position 3 03 - Methio- 
nin/Aginin und 311 Arginin/Lysin sind different) und im 
Intron'4, das im Zinkf inger liegt, nachweisbar sind, 

m - 

^^bei BB/OK-Ratten YY1 in isolierten Langerhansschen Inseln 
und Pankreas deutlich und bei SHR- und BB.SS-Ratten kaum, in 
den anderen untersuchten Organen jedoch vergleichbar, aber 
mit 2 Banden bei BB . 6S nach Amplif izierung des Zinkf ingerbe- 
reich.es exprimiert ist, 

wurde der Schlufi gezogen, dafi YY1 bei BB.6S in Langerhansschen 
Inseln unter exprimiert ist und damit diabetesprotektiv wirkt, 
wobei die zweite Bande im Pankreas und anderen Geweben eben- 
falls fur die Diabetesprotektion von Bedeutung ist, zumal dem 
■inkf inger 2 eine besondere Rolle bei der Transkription zuge- 
Iprochen wird. Eine Beobachtung, die durch die AS -Anderung im 
Zinkf ingerbereich und/oder im Intron (unterschiedliches 
SpleiSverhalten bei BB/OK und BB.6S) verursacht ist. 

Da die Anderung im Zinkf ingerbereich eine diabetesprotektive 
Wirkung bat, sind mehrere Gene in ihrer Regulation/Aktivitat 
beeintrachtigt/verandert • Fur eine Beteiligung des Introns an 
der Diabetesprotektion spricht die Tatsache, daS die Sequen- 
zunterschiede zwischen BB/OK und SHR nachweisbar waren, nicht 
aber zwischen BB/OK und Wildf angtieren. Die Sequenz zwischen 
BB/OK und Wildf angtieren war gleich. Dies wiederum erklart, 
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warum BB.6S-, nicht aber BB . 6W -Ratten vor der Entwicklung ei- 
nes Diabetes geschiitzt sind. 

Infolge der erf indungsgemafe gewonnenen Erkenntnisse eroffnet 
die Modulation des multifunktionellen Transkriptionsf aktors 
YY1 auf Expressions- und Regulationsebene zum einen erstmals 
einen Weg, urn Typ-1 -Diabetes zu verhindern, zum anderen lassen 
sich durch diese Modulation auch Autoinununerkrankungen als 
solche verhindern, Ferner lassen sich auch weitere Erkrankun- 
gen wie Krebs, AIDS , Fettstof f wechselstorungen und Hypertonie 
positiv beeinf lussen. 

^^j^genstand der vorliegenden Erfindung ist daher ein Protein, 
das die in SEQ ID NO: 4 dargestellte Aminosauresequenz auf- 
weist. Ferner eingeschlossen sind Homologe des Proteins, die 
Arginin und an Position 311 Lysin aufweist. Der Homologiegrad 
betragt mindestens 95%, vorzugsweise mindestens 97%, und be- 
sonders bevorzugt mindestens 99%. 

Die Erfindung betrifft auch Peptide, die Fragmente eines vor- 
genannten Proteins sind und eine Aminosauresequenz aufweisen, 
die den die Aminosaurepositionen 303 und 311 in SEQ ID NO: 4 

•jfbzw. 306 und 314 in SEQ ID NO: 6) umfassenden Sequenzbereich 
Inthalt. Die Lange der erf indungsgemafien Peptide betragt bei- 
spielsweise 53 bis 315 Aminosauren, vorzugsweise z.B. 315, 117 
oder 53 Aminosauren, wobei die Peptide vorzugsweise die Se- 
quenzbereiche von Position 1 bis 315, von 295 bis 411 bzw. von 
299 bis 351 umfassen. 

Erf indungsgemaE sind ferner folgende Fragmente wichtig: Ami- 
nosauren 165-214; 255-333; 255-411. Die Numerierung bezieht 
sich auf die Numerierung gemaS SEQ ID NO: 4. 

GemaE einer bevorzugt en Ausfuhrangsf ortti der Erfindung sind 
auch Peptide von Bedeutung, die nur einen Bereich von z.B. Po- 
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sition 295-310 oder 305-320 (Numerierung bezogen auf SEQ ID 
NO: 4) abdecken und somit nur eine der beiden mutierten Ami- 
nosauren einschliefien. 

Die Erfindung betrifft ferner eine Nukleinsaure, die fur ein 
vorgenanntes Protein oder Peptid kodiert. Die fiir das Protein 
mit der in SEQ ID NO: 4 kodierende Nukleinsaure weist vorzugs- 
weise die in SEQ ID NO: 3 dargestellte Nukleinsauresequenz auf. 
Eine fur die vorgenannten Homologen kodierende Nukleinsaure 
weist eine Nukleinsauresequenz auf, die den die Nukleinsaure- 
positionen 979-981 und 1003-1005 in SEQ ID NO:3 umfassenden 
• rwuenzbere i ch enthalt. Die Codons an den genannten Positionen 
^Rj^^men selbstverstandlich infolge der Degeneration des geneti- 
schen Codes variieren, solange sie fur die Aminosauren Arginin 
bzw. Lysin kodieren. 

Erf indungsgemaJS ist ferner die Intronsequenz wichtig: 1126- 
1758. (Die Lage der Exons in SEQ ID NO: 3 ist: Exon 1:73 bis 
729; Exon 2: 730 bis 825; Exon 3: 826 bis 978; Exon 4: 979 bis 
1125; Exon 5: 1759 bis 1938; siehe Sequenprotokoll . ) Die Nume- 
rierung bezieht sich auf die Numerierung gemaS SEQ ID NO: 3. 

rS ^jkiabetes Mellifcus Typ 1 und Autoimmunerkrankiingen an sich. 

^^^Wie bereits erwahnt, resultiert Typ-l-Diabetes aus der selek- 
tiven Zerstorung der Insulin-produzierenden p-Zellen im Pankre- 
as. Der Untergang der p-Zellen wird durch autoreaktive T- 
Zellen, die gegen p-Zell-spezif ische Antigene (Autoantigene) 
gerichtet sind, gesteuert . Mit der Diabetesmanif estation ver- 
bunden ist eine Insulitis (69) . Dieser Prozess ist gekenn- 
zeichnet durch die lymphozytare Infiltration der P -Zelle. Da 
eine Insulitis nicht immer die Antwort auf eine P~ 
Zelldestruktion sein mu£, unterscheidet man zwischen einer be- 
nignen und destruktiven Insulitis (70) . Dieser ProzeB korre- 
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liert mit der Cytokinproduktion, wie fur Modelltiere (BB- 
Ratte) und fur den Menschen gezeigt we r den konnte (71-78) . Da- 
bei spielen die Cytokine IFNy und IFNa wahrend der destruktiver 
Insulitis eine Hauptrolle. Fur die benigne Insulitis werden 
IL10 und TGFP als Hauptf aktoren angesehen. Daruber hinaus konn- 
te in nicht-diabetischen Mausen Insulitis durch TNFa, TNFp, so- 
wie IL6 induziert werden, was jedoch nicht zu einer £- 
Zellzerstorung fiihrte. Bei transgener Expression von IFNa, IFNy 
und IL2 konnte gezeigt werden, daS nicht -diabetische Mause ei- 
ne Insulitis und einen autoimmunen Typ-1 -Diabetes entwickeln. 
ch sind IFNy, IFNa, IL2 und IL10 bei der Entstehung, TNFa, 
r 4, IL6, sowie TGFJ3 bei der Verhinderung des Typ-1 -Diabetes 
involviert (71-81) . 

Da alle BB.6S-Ratten eine Insulitis entwickeln, Diabetes aber 
nur bei etwa 15% der Tiere auftritt (82) , muS YY1 auch beim 
InsulitisprozeS eine. Rolle spielen. Entweder schaltet YY1 die 
protektiven Cytokine an, unterdruckt die pathogenen Cytokine 
oder er balanciert beide Cytokingruppen so, dafi zum einen die 
|3-zelldestruktive Insulitis auftritt oder aber die benigne In- 
sulitis, die nicht zum autoimmunen Diabetes fuhrt, zum Tragen 
"ortimt. Da er auch in der Lage ist, IL4 zu aktivieren (83) und 
FNy zu inhibieren (84) , wird erf indungsgemaS davon ausgegan- 
gen, daS er auch die Relation der T-Helf erzellpopulationen, 
TH1 und TH2, zugunsten von TH2 verschiebt. 

Ist durch eine Mutation die AS-Sequenz von YY1 bei Typ-1 - 
Diabetikern verandert, kann er nicht mehr an bestimmte Sequen- 
zen in der DNA binden, oder aber seine Affinitat zur Bindungs- 
stelle ist reduziert. D.h., er kann nicht mehr an den IFNy- 
Promotor binden, oder mit zu niedriger Affinitat, und die IFNy- 
Synthese auch nicht mehr hemmen. Eine Dberproduktion von IFNy 
ware die Folge. Diese Dberproduktion konnte dann zu einer In- 
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sulitis fuhren. Da IFNy die TH1 Antwort aktiviert, indem er die 
MHC-Klasse-I-Proteine auf der Oberflache von p-Zellen hochregu- 
liert (85,86) und sogleich die T-Zelldif f erenzierung in Rich- 
tung TH1 beeinfluSt und dadurch die TH2 -Antwort reduziert, wa- 
re eine Verschiebung zwischen TH1 und TH2 gegeben, wie es beim 
autoimmunen Diabetes postuliert wird. Dariiber hinaus ist be- 
kannt, daS Makrophagen zuerst in der {3-Zelle nachweisbar sind. 
Da IFNy ein Stimulator fur Makrophagen ist, kann die frtihe Ein- 
wanderung in die p-Zelle dadurch erklart werden, daS IFNy nicht 
mehr durch YY1 geheramt wird. Zusatzlich ist YY1 auch pradesti- 

•ert, die IL4 Synthese einzuleiten (83) . Ist dieser Fakt 
|rch Sequenzveranderung oder Unterproduktion von YY1 auch 
nicht gegeben, kann die TH1 -Antwort nicht mehr durch IL4 als 
protektives Cytokin unterdruckt werden. Aufgrund einer erhoh- 
ten Aktivitat von TH1 konnen cytotoxische T-Zellen (CTL oder 
CD8 + ) und NK-Zellen ihre Funktion in der p-Zelle als „Killer 
Zellen u wahrnehmen. Der apoptotische p-Zelltod, induziert durch 
FAS-Rezeptoren unter Interaktion mit dem FAS-Liganden, kann 
durch YY1 auch zusatzlich noch induziert werden (87) . Ist der 
Transkriptionsfaktor bei Typ-l-Diabetikern mutiert, kann er 
nicht mehr in vollem MaSe die FAS -Express ion hemmen. Somit er- 
id"**pcheint FAS auf der Oberflache von P-Zellen, und die apoptoti- 
Ji^^feche Signalkaskade ist aktiviert. Das Resultat ist der P~ 
Zelltod und damit Typ-1 -Diabetes . 

Da neonatale Thymektomie bei Modelltieren (BB-Ratte und NOD- 
Maus) die Entstehung eines Typ-1 -Diabetes verhindert (88) , 
wird u.a. auch vermutet, dafi beim Typ-l-Diabetes autoreaktive 
T-Zellen schon wahrend der T-Zelldiff erenzierung entstehen. 
D.h., YY1 muEte schon in einem fruhen Stadium der T- 
Zellentwicklung eingreifen, was man sich wie folgt vorstellen 
konnte : 
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Um ein funktionales Lymphozytenrepertoire zu eiitwickelii, mus- 
sen die Vorlauf erzellen, sogenannte Prathymozyten, verschie- 
denste Entwicklungsstadien im Thymus durchlaufen. Da nur etwa 
2% reifer T-Zellen den Thymus verlassen konnen, liegt eine 
strenge Selektion wahrend der T-Zellreifung vor, welche uber 
Tod oder Uberleben entscheidet. Ein Regulationspunkt ist im 
f riihen Thymozytenstadium, dem „Doppelt Negativen u (DN) , veran- 
kert. Hier entscheidet der auf der Oberflache befindliche pra- 
T-Zell-Rezeptor (preTCR) , bestehend aus CD44 (0-Kette) und der 
invarianten Kette pTa, ob ein Eintreten in den Zellzyklus mog- 
^^^^ch ist. Dieser Kontrollpunkt wird auch als „ Beta- Checkpoint u 
M 11 ^Meichnet. Die unreifen T-Zellen verweilen solange in diesem 
^^W^adium, bis das richtige a-Ketten-Gen umgeordnet ist und der 
T-Zell-Rezeptor (TCR) , bestehend aus a- und p-Kette, auf der 
Oberflache exprimiert werden kann. Erscheinen beide T-Zell- 
Rezeptoren CD4 plus CD8 zusammen mit CD 3 auf der Oberflache, 
werden diese T-Zellen nun als „Doppelt Positiv w (DP) bezeich- 
net. Etwa 95% erreichen dieses Stadium nicht. Dies unter- 
streicht die Bedeutung des Kontrollpunktes beim Ubergang vom 
DN- zum DP- Stadium (89) . 

•A.ls kritischer Gesichtspunkt wird dabei die Regulation der Ex- 
pression der pTcc-Kette betrachtet. Die pTa- Gent ranskript ion 
scheint bisher vorallem durch den upstream Bereich, dem Enhan- 
cer , entscheidend reguliert zu werden. Mehrere Proteine, unter 
ihnen befindet sich auch YY1, die in der Lage sind, an diesen 
Bereich zu binden, wurden identif iziert (90) . Als weitere Bin- 
dungsproteine des Enhancer sind zu nennen: SPl/3, ZBP-89 und 
c-MYC. Betrachtet man diese Proteine im Zusammenhang mit YY1, 
kann man schluSf olgern, dafi alle, ausgenommen ZBP-89, mit YY1 
interagieren, so daS als weiterer Regulationspunkt von YY1 
auch die T-Zellreifung angesehen wird. Unterstutzt wird diese 
Annahme durch Befunde von Iritani et. al. (91) . Sie konnten 
zeigen, daS c-MYC allein nicht in der Lage ist, die pTa- 
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Expression zu regulieren. Nur verschiedenste c-MYC Konzentra- 
tionen schienen zum Teil einen EinfluS auf den Zellwachstum- 
sarrest ira spaten DP -Stadium zu haben. 1st YY1 im Thymus 
uberexprimiert, schaltet er die Transkription pTa an. In umge- 
kehrter Weise, bei Unterexpression, verhindert er die pTa- 
Transkription. Bei Uberexpression oder Unterexpression, sowie 
Sequenzveranderungen von YY1 konnen T-Zellen wahrend ihrer 
Eritwicklung in den Arrest geschickt oder aber in ein weiteres 
T-Zell stadium uberfuhrt werden. 

I a die T-Zellreif ung und deren Selektion bei alien Autoim- 
■lerkrankungen, wie Rheumatoide Arthritis, Multiple Sklerose, 
ntoimmune Encephalomyelitis, Zoliakie u.a., entscheidend ist, 
konnen neben dem Typ-1 -Diabetes auch Aut o immune rkr ankungen 
per se durch YY1 beeinfluSt werden, was durch Auf- oder Abre- 
gulation von YY1 erreicht wird. 

Es wird davon ausgegangen, daS sich die YYl-Sequenz zwischen 
Typ-l-D.iabetiker und gesunden Probanden unterscheidet . Mehrere 
Sequenzvarianten werden fur Typ-l-Diabetiker erwartet, da es 
neben dem klassischen Typ-l-Diabetiker auch noch weitere For- 
men fur Typ-1 -Diabetes exist ieren, wie zum Beispiel der LADA 
■Latent Autoimmune Diabetes in Adults) . Diese Sequenzvarian- 
pben sollen als genetischer Marker fur die Pradiabetiker ge- 
nutzt werden. Der Nachweis der Anderung basiert auf der DNA- 
Sequenzierung, wobei Vollblut gewonnen, DNA bzw. RNA, die urn- 
geschrieben wird in ssDNA, isoliert und dann sequenziert wird. 
Parallel dazu wird das Express ionsprof il fur Typ-l-Diabetiker 
erstellt. In Anbetracht der Tatsache, daS die Krankheit eines 
jeden Typ-1 -Diabetikers individuell verlauft, wird erwartet, 
dafi das Expressionsprof il von Proband zu Proband unterschied- 
lich ist. In Abhangigkeit vom Alter des Probanden, vom Ge- 
schlecht, vom Autoantikorper status [GAD (Glutamatdecarboxyla- 
se) , IA-2 (Proteintyrosinphosphatase) , ICA (zytoplasmatische 
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Inselzellautoantikorper) ] vom BMI , sowie vom HLA-Genotyp (HLA- 
DQB1) werdeii unterschiedliche Express ionsprof ile erwartet. 
Demnach soil eine entsprechende Prophylaxe/Therapie auch indi- 
viduell zuges chni t ten werden. Durch die genetische Heterogenic 
tat interagiert YY1 bei jedem Individuum mit einem differenten 
genetischen Hintergrund, so daS die YY1- Express ion zwisciien 
den Individuen groSen Schwankungen unterliegen wird. 

Eine Abregulation kann uber Applikation von Ant i sense und 
durch Herstellung spezifischer Antikorper fur den jeweiligen 
Probanden erreiclit werden. Die Struktur der Antisense und der 

•ikorper ergibt sich aus der Sequenzfolge des Probanden. Die 
applizierende Menge der Antisense sowie Antikorper ergibt 
sich aus dem Expressionsprof il des Probanden. 

Dafi YY1 selbst als Autoantigen fungiert, liegt nahe, weil bis 
dato das auslosende Autoantigen fur die Zerstorung der Insu- 
lin-produzierenden Beta-Zelle immer noch nicht bekannt ist. 
Liegt eine Bestatigung vor, daS YY1 als ' Autoantigen fungiert, 
soil \iber orale Verabreichung von YY1 Toleranz induziert wer- 
den, wie es bei Allergikern durch Hypersensibilisierung be- 
reits erfolgt. Dabei soil fur den jeweiligen Probanden oder 
$"flBProbandengruppen die Sequenzvarianten erfaBt und anschlieSend 
W" KLie mutierte Form synthetisch hergestellt werden, urn es oral 
^^verabreichen zu konnen. Damit soli eine Verschiebung des 
TH1/TH2 Profils erreicht werden, urn der autoimmunen Zerstorung 
entgegenzuwirken . 

Allergien 

Neben der Involvierung von YY1 im Auto immun- Pro zeS spiel t die- 
ser Faktor auch eine wesentliche Rolle in der Klasse der fiber- 
empfindlichkeits- oder auch Hyper sens ibil tat sreaktionen des 
Imnvunsystems, den sogenannten Allergien. Darunter versteht man 
eine Immunreaktion gegenuber einem ansonsten harmlosen Antigen 
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oder Allergen. Man unterscheidet 4 verschiedene Reaktionstypen 
(92) . Die Typen I bis III werden durch Antikorper vermittelt 
(Soforttyp) , wobei der vierte Typ durch Aktivierung spezifi- 
scher T- Zellen verursacht wird (verzogerter Typ) . 



Tabelle 2 : . 





TypI 


Typ n 


Typm 


Typ IV 


Immim- 
komponente 


IgE-AK, TH 2 - 
Zellen 


IgG-AK 


IgG- AK 


T-Zellen 


Antigen (Ag) 


losliches Ag 


zell- oder matrix- 
assoziiertes Ag 


ISsliches Ag 


losliches Ag 


zellassoziiertes Ag 


M — 

Hchanismus 


Mastzell- 
aktivierung 


Komplement- system 


Komplement- 

system, 

Phagozyten 


Makropha- 

genaktivier- 

ling 


Cytotoxizitat 


Beispiele 


allergische 

Rhinitis, 

Asthma 


Medikamenten- 
allergien 


Semmkrank-heit 


Kontakt- 
deimatitis, 
Tuberkulin- 
reaktion 


Kontakt-dermatitis 
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Die Uberempf indlichkeit vom Typ I wird nur dann ausgelost, 
wenn Antigene (Ag) bzw. Allergene bereits vorhandene IgE- 
Antikorper (AK) , welche auf den Fc-Rezeptoren von Mastzellen 

tebunden sind, guervernetzen. Dies fuhrt zur Degranulation 
ieser Zellen mit der Freisetzung von Entziindungsmediatoren, 
ie Histamin und Leukotriene, im Sinne einer allergischen Re- 
aktion vom Soforttyp. Fiir die Bildung von IgE-AK sind IL4- 
produzierende TH2- Zellen notwendig. Diese TH2- Zellen, akti- 
viert durch das Allergen, losen die Produktion von IL4 aus, 
was einen Klassenswitch von IgM nach IgE in B-Zellen zur Folge 
hat. Das von den B-Zellen sezernierte IgE bindet an die 
hochaffinen Rezeptoren von Mastzellen, basophilen und eosino- 
philen Zellen. Tritt ein Allergen nochmals uber die Schleim- 
haute ein, bindet es auf den bereits vorhandenen IgE-AK der 
Mastzellen. Die Folge ist eine Ruckkopplung. Das heiSt, die 
aktivierten Mastzellen produzieren neben den B-Zellen auch IL4 
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und binden gleichzeitig uber ihren CD4 0 - Liganden an den CD40- 
Rezeptor der B-Zelle, wodurch die B-Zellen zu einer weiteren 
Produktion von IgE stimuliert werden. An diese Reaktion 
schlieSt sich haufig eine sogenannte Spatphasenreaktion mit 
der E inwande rung von eosinophilen Granulozyten und anderen 
Entzundungsquellen an, die bei wiederholter Auslosung in die 
chronische allergische Entzundung einmundet. Das ebenfalls von 
TH2-Zellen gebildete IL5 tragt weiterhin zur Ausbildung einer 
eosinophil gepragten Entzundungs reaktion bei, indent es direkt 
Oder indirekt (z. B. durch die -Induktion von Chemokinen) die 
Produktion . von Eosinophilen im Knochenmark anregt, chemotak- 




ch und aktivierend auf Eosinophile wirkt und auch ilir Uber- 
en im entziindeten Gewebe verlangert (92-95) . 



Die Gegenspieler der TH2-Zellen sind die THl-Zellen, die vor 
allem durch ihre Produktion von IFNy die IgE -Produktion hemmen 
(94) . IFNy veranlaSt B-Zellen zu einem Immunglobulinklassen- 
wechsel hin zur Produktion von IgG, welches nach Bindung an 
seine Rezeptoren auf Basophilen/Mastzellen die IgE-Rezeptor- 
vermittelte Degranulation dieser Zellen zusatzlich hemmt (95) . 

Wei tere Cytokine , GM- CSF (Granolozyten-Makrophagen- Colony- 

I|timulating-Factor) , IL13, IL9, IL3 , als auch das zuvor ge- 
hannte IL5 regeln das Uberleben und die Vermehrung von 
Mastzellen. Das Produktionsgleichgewicht zwischen alien Cyto- 
kinen, insbesondere zwischen IL4 und IFNy, stellt einen wichti- 
gen Regelmechanismus dar. 

Wie bereits beim Typ-1 -Diabetes und Autoimmtinerkrankungen dar- 
gestellt, aktiviert YY1 die IL4 Produktion uber die Bindung 
des Promotors (96) bzw. hemmt die IFNy Produktion (97) . Somit 
ist eine Aktivierung des Klassenswitches in Richtung allergen- 
spezifischer IgE-Antikorpern gegeben, aber auch die Ausschal- 
tung des Gegenspielers IFNy bei allergischer Reaktionen vom So- 
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forttyp (Typl) ; vgl. Ye et. al. (98). Die Untersuchungen des 
humanen IL3- Promo tors in T-Zellen zeigten, d$i£ YY1 die IL3- 
Produktion durch die Inhibierung von ASRF (AP- 2 -Sequence - 
Recognizing -Factor) aktivieren kann, da ASRF niclit mehr mit 
dem NIP-Element (Nuclear- Inhibitory- Protein) assoziiert. Folg- 
lich ist die unterstiitzende Wirkung auf die Vermehrung von 
Mastzellen durch YY1 uber IL3 moglich. 

Im Gegensatz dazu fuhrten verschiedenste Arbeiten am IL5- 
Promotor und GM-CSF-Promotor dazu, daS sich YY1 hier auch als 
regulatorischer Faktor erwies . Der GM-CSF, aber auch IL-5 wur- 

• durch ihn supprimiert , d.h. das Uberleben und die Vermeh- 
g . von Mastzellen, als Grundyorraussetzung allergischer Re- 
aktionen vom Soforttyp, ist gestort (99,100) (vgl. Fig. 5) . 

LaSt man die biologische Funktion und die daraus resultierende 
Konsequenz nicht auSer acht, kann man zusammenf assend sagen, 
daS YY1 zum einen allergische Reaktionen vom Soforttyp unter- 
stiitzen, moglicherweise auch auslosen kann und zum anderen 
allergische Reaktionen unterdruckt, indem er die Cytokinspek- 
trumbal lance in die jeweilige Richtung verschiebt, was von 
seinen Konzentrationsverhaltnissen abhangen kann. 

j? -^Bi e Verschiebung des Cytokinspektrums ware auch eine mogliche 
^^Ursache fur den verzogerten Typ (Typ IV) , der durch T-Zellen 
vermittelt wird. Der zeitliche phasische Verlauf erstreckt 
sich im Gegensatz zum Soforttyp von 24 Stunden bis hin zu 72 
Stunden. In der ersten Phase wird das Antigen auf genommen , 
verarbeitet und durch lokale antigenprasentierende Zellen uber 
den MHC-Klasse-II-Molekulen vorgezeigt. In der zweiten Phase 
wandern die antigenspezif isch gepragten THl-Zellen zur Injek- 
tionsstelle und setzen Chemokine, Cytokine (IFNy, IL3 , GM-CSF), 
sowie Cytotoxine (TNF a und P) f rei . Durch die Freisetzung die- 
ser Botenstoffe werden Makrophagen angelockt und aktiviert, 
die wiederum Antigene prasentieren und somit die Reaktion ver- 
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starken. Die Folge ist die lokale Gewebsschadigung durch die 
f reigesetzten Botenstoffe und durch die Totting sensibilisier- 
ter Zellen mittels TGFP und FAS-Liganden (CD95L) . 

Die Expression von IFNy, IL3, CD 95 und GM-CSF werden durch YY1 
reguliert, was den SchluS zulaSt, daS YY1 auch bei dem verzo- 
gerten Typ von Uberempf indlichkeitsreaktionen eine Rolle 
spielt. Seine Funktion beruht demnach auf einer Gewebsschadi- 
gung, da er in der Lage ist, die IFNy- , GM-CSF- und die FAS- 
Expression in Abwesenheit von NO zu inhibieren (101) . Gleich- 
zeitig kann YY1 aber die IL3-Expression aktivieren. Daher soli 
B*ch Ab- bzw. Auf regulation von YY1 die Entwicklung von All- 
pPgien beeinflufit werden. 

Protoonkogene und Krebs 

Das c-MYC Gen wurde ursprunglich als zellulares Homolog des 
retroviralen v-rayc Onkogens in den 70er Jahren entdeckt. Em- 
bryonal e Lethalitat ist das Ergebnis einer Deletion dieses 
Gens. Das Produkt eines c-MYC Protoonkogens ist das c-MYC 
Protein, welches - ebenso wie YY1- einen multifunktioneller 
Transkriptionsfaktor darstellt. Eine entscheidende Rolle 
kpielt c-MYC in der Dif f erenzierung, dem Zellwachstum, Pro- 
liferation, Transformation und Apoptosis von Zellen. Die 
Dysregulationen der c-MYC Expression stehen im Zusammenhang 
mit abnormen malignen Zellwachstum und somit der Tumor ent s t e - 
hung von Lungenkrebs, Brustkrebs und Darmkrebs . Dies zeigt, 
da£ c-MYC als starker Regulator des Zellwachstums , der Zell- 
diff erenzierung und Zellprolif eration ebenso stark kontrol- 
liert wie balanciert werden mu£, urn die Carzinomentstehung zu 
verhindern (102-104) . 

Da YY1 als vielseitiger Regulator in Abwesenheit von dem es- 
sentiellen Partnerprotein (MAX) direkt an den C-terminalen 
Teil des basischen Helix-Loop-Helix (bHLH) Zinkfingers von c- 
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MYC binden kann, spielt YY1 auch bei der Krebsentstehung eine 
bedeutende Rolle. Hierbei ist YY1 in der Lage, jeden seiner 
vier Zinkfinger dazu zu .benutzen, urn an das c-MYC Protein zu 
binden. Nicht moglich ist es YY1 jedoch, die Verbindung zwi- 
schen dem Komplex von c-MYC/MAX zu unterbrechen. Da aber trotz 
Komplexbildung zwischen YY1 und c-MYC die sequenzspezif ische 
DNA-Bindung von YY1 nicht blockiert wird, ist die Regulation 
auf DNA-Ebene durch YY1 immer noch moglich . 

Das humane c-MYC Gen kodiert zwei Polypeptide (43 9 und 453 
Aminosauren) mit einem Molekulargewicht von 64 und 67 kDa und 

•t im Zellkern lokalisiert. Der Translationsstart des grofie- 
^* Proteins liegt am Ende des ersten Exons, wahrend die klei- 
-nere und meist vorherrschende Form des Proteins durch Transla- 
tion im zweiten Exon initiiert wird. 

C-MYC ist ein Transkriptionsf aktor, der basische Helix-Loop- 
Helix/Leuz in- Zipper Domane (bHLH-LZ) aufweist, wobei diese 
konservierten Domanen Bestandteil vieler Transkriptionsf akto- 
ren sind und Protein/Protein, sowie Protein/DNA-Interaktionen 
verrnitteln. 

^^^C-MYC ist Teil einer Genfamilie, die noch weitere Mitglieder 
|p N- , S- und B-myc beinhaltet (105-108) . 

Die Bindung von c-MYC an die DNA erfolgt uber die sogenannte 
E-Box, eine spezif ische regulatorische Sequenz der Basen 5 1 - 
CACGTG-3 1 . Zur Aktivierung der Transkription muS das c-MYC 
Protein mit dem Partnerprotein MAX heterodimere Komplexe aus- 
bilden (109) . MAX gehort ebenfalls zu den bHLH-LZ Proteinen, 
besitzt aber keine transaktivierende Domane wie c-MYC (110) . 
Die Heterodimerisierung mit MAX ist essentiell fur die Funk- 
tionen von c-MYC, wie Regulation des Zellzyklus, Einleiten von 
Apoptose oder Transformation von Zellen. MAX bildet weiterhin 
mit den bHLH-LZ Proteinen der MAD-Pamilie Komplexe, Diese He- 
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terodimere binden ebenfalls spezifisctL an 'E-Boxen und wirken 
transkript ionsreprimierend uber Sin3 -vermittelte Rekrutierung 
von Histondeacetylasen (111) . 

Demnach sollte durch Ab- oder auch Auf regulation von YY1, be- 
dingt durch seine vielf altigen Interaktionen mit anderen Ge- 
nen, auch uber c-MYC durch Induktion zahlreicher Gene wie 
nachfolgend zusammengestellt (112,113), eine Beeinf lussung der 
Krebsentstehung moglich sein. 

Zielgene des c-MYC-Proteins 




Metabolismus 

-Ornithindecarboxylase (ODC) , Schlusselenzym der Proteinbio- 
synthese, essentiell fur die Proliferation von Zellen. 

DNA- Dynamik 

-Prothymosin-a (saures Kernprotein) , Uberexprimierung von Pro- 
thymosin-modulierte Chromatinstruktur , Acetylierung von Hi- 

•fctonen 
FUntereinheit der Telomerase (htert) 
Zellzykluskontrolle 

-Cullin-1, essentieller Bestandteil des Ubiquitin Ligasekomple- 
xes SCF SKP2 

-Id-2 , inaktiviert die hypophosphorylierten Pocketproteine 
pRb, pl07 und pl30. 

2 . Repression von 



Miz-1, Cdk2- Inhibitor p21, Cdk4/6- Inhibitor pl5 INK4b. 
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Immunschwacheerkrankung AIDS 

Seit der Erstbeschreibung von HIV-1 im Jahr 1983 (114, 115) 
und HIV-2 im Jahr 1986 (116) sind diese beiden Viren als Aus- 
loser der erworbenen Immunschwacheerkrankung AIDS identifi- 
ziert. Trotz vieler tlierapeutischer Fortschxitte in den letz- 
ten Jahren ist eine Eradikation des Virus jedoch immer noch 
nicht moglich. Der individuelle Krankheitsverlauf , bei glei- 
cher Infektionsquelle, ist durch virale aber auch durch Wirts- 
Faktoren bestimmt (117) . 




:tur und Aufbau von HIV-1 



HIV-1 ist ein Retrovirus, welcher zu der Familie der Lentivi- 
ren gehort. Der Viruspartikel ist im Durchmesser rund 100 nm 
groS und von einer Lipoproteinhulle umgeben. tfedes Partikel 
besitzt . zwei Kopien des RNA-Genoms, die in der infizierten 
Zelle in die DNA- Form uberschrieben und dann ins Chromosom der 
Wirtszellen eingebaut werden. Das gesamte HIV-Genom besteht 
aus neun Genen, die von Long Terminal Repeats eingerahmt (LTR) 
werden. Die LTRs sind fur die Integration in die DNA der 
Wirtszelle essentiell. Die Organisation des viralen Genoms 
^eichnet sich durch. drei Hauptgene: gag, pol und env (gag be- 
Ksutet "group-antigen", pol steht fur "polymerase" und . env 
Kteht fur "envelope") aus. Diese Gene gag, pol, und env codie- 
ren fiir Strukturproteine, Enzyme und Glycoproteine der Virus - 
hiille. 

In. der Virushiille sind 72 etwa 10 nm groSe env- 
Glykoproteinkomplexe eingebetet. Diese bestehen aus einem ex- 
temen Anteil (gpl20) und einem Transmembranprotein (gp41) . 
Aufgrund einer vorhandenen losen Bindung von gpl20 an gp41 und 
der Hullmembran, kann gpl20 spontan freigesetzt werden, was 
als "shedding" bezeichnet wird. Das Glykoprotein gpl20/l60 
gilt als Marker und kann sowohl im Serum (118) als auch. im 
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lymphatischen Gewebe von HIV-inf izierter Patienten nachgewie- 
sen we r den (119) . Die Virushulle entha.lt zusatzlich noch ver- 
sch.ied.ene Proteine der Wirtszelle, z. B. HLA Klasse I- und II- 
Molekule, die beim Abscheiden des Virus ("budding") aus der 
virusproduzierenden Zelle in des sen Membran inkorporiert wer- 
den. Adhasionsproteine, wie zum Beispiel ICAM-1, erleichtern 
das Anheften an andere Zielzellen. Das pl7-Matrixprotein ist 
an der Innenseite der Virushulle verankert . Das p24-Kapsid- 
Antigen ("core antigen") ist von zylindrischer Gestalt und 
enthalt zwei Kopien der HIV-RNA. Diese liegt ihrerseits als 
Protein-Nukleinsaurekomplex, gebunden an das Nukleoprotein p7 
fad ' die reverse Transkriptase p66, vor. Neben der reversen 
^panskriptase (RT) enthalt das Viruspartikel auch andere Enzy- 
me, die Integrase p32 und die Protease pll, die es fur seine 
Vermehrung benotigt. 

Der Eintritt von HIV in seine Zielzelle erfolgt zum einen uber 
den CD4-TCR als primarer Rezeptor, oder aber uber Chemokinre- 
zeptoren CCR5 und CXCR4 (Fusin) (120-123) . 




CD4 wurde als primarer und essentieller Rezeptor von HIV-1, 
HIV-2 und SIV bereits 1984 charakterisiert (124, 125) . Die 
indung von gpl2 0 an CD4 ist ein wesentlicher Schritt bei der 
nfektion CD4 + T-Zellen. Durch diese Bindung werden zusatzlich 
noch intrazellulare Signalkaskaden angeschaltet , die einen 
apoptose-f ordernden Effekt auf T-Zellen haben (124) . Experi- 
mente zeigten jedoch, daS die Expression von humanem CD4 auf 
der Zelloberf lache fur einen erf olgreichen Viruseintritt nicht 
ausreichend ist. Die Existenz humaner Corezeptoren fur den 
Eintritt von HIV in seine Wirtszelle konnten schon fruh. ge- 
zeigt werden. Andererseits konnen einige Laborisolate von HIV- 
1 und HIV-2 CD4 -unabhangig Zellen infizieren. 



Jedoch scheinen die CCR5 und CXCR4 die pradominanten Corezep- 
toren fur M- bzw. T- trope HIV- Isolate darzustellen. Die Bedeu- 



40 



tung von CCR5 als dominantem Corezeptor fur M- trope HIV- 
Isolate wird auch dadurch deutlich, dafi Individuen rait einem 
genetischen Defekt des CCR5 gegenuber HIV weitgehend resistent 
sind (127) . 

Als regulierende Faktoren der HIV-Transkription und der vira- 
len Replikation nach Integration in das Wirtsgenom werden die 
LTRs (Long Terminal Repeats) , TAT (viraler Aktivator) , HDAC 
(Histon Deacetylase) sowie die Transkript ions faktoren YY1, 
USF1/2 (upstream regulatory factor) und LSF (Late SV 40 Fac- 
tor) angesehen (128,129). 

m ijW 11 et.al. (129) konnten zeigen, daS YY1 mit LSF in vivo und 

in vitro interagiert und als Komplex die HIV-1 LTR Expression 
reprimieren kann. Da die Uberexpression von LSF alleine zu 
keiner LTR- Transkr ip t ionsrepres s ion fuhrte, ist die Anwesen- 
heit von YY1 essentiell, urn die Transkription zu inhibieren. 
Die Zinkf inger-Domane von YY1 ist fur die spezifische LSF- 
Bindung unabdingbar. Der Mechanismus der effizienten Reprimie- 
rung der LTR- Express ion konnte auf die Rekrutierung der HDAC 
durch YY1 (Glycin/Alanin reiche Domane) eindeutig zuriickge- 
fuhrt werden (128) . 

•o_n weiterer Regelmeclianismus konnte von der Gruppe Moriuchi 
t al. aufgeklart werden (130) . Diese Studie zeigt, daS die 
Promotoraktivitat von CXCR4 von C-MYC/USF1/USF2 aufreguliert 
und von YY1 abreguliert wird. Gleichnamig zu c-MYC ist der 
SDF-l-Ligand in der Lage, die Oberf lachenexpression von CXCR4 
als Fusions- und Eintrittsstelle zu aktivieren. Die aktivie- 
renden Faktoren, c-MYC, USF1 und USF2 , binden alle an die E-Box 
des CXCR4-Promotors, aber mit unterschiedlichen Affinitaten. 
Die hochste Affinitat zur E-Box erwies sich. fur USF1 und USF2 . 
Eine enorme Reduzierung der Promotor-Aktivitat bis zu 8 0% 
konnte durch die Uberexpression von YY1 als Gegenspieler er- 
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zielt werden (130) . Daraus resultiert die eraiedrigte CXCR4- 
Expression auf der Oberflache von naiven T-Zellen. 

FaSt man die Ergebnisse zusammen, so zeigt sich, dafi YY1 ein 
potent ieller HIV-Repressor ist, bis da to der Alleinige, wel- 
cher die Eintritts- und Pusionsstellen des HIV- Viruses wei- 
testgehend blockiert. Er greift mit inhibierender Wirkung in 
die LTR- aber auch in die CXCR4 -Expression ein und blockiert 
somit den essentiellen Eintritt und die Fusion des HIV-Viruses 
in das Wirtsgenom. Daher konnen durch Uberexpression von YY1 
HIV-Patienten mit raschem Krankheitsverlauf in sogenannte HIV- 
.gzeituberlebende ("LTNP" = "Long term non-progressors") zu 
.sf erieren. 



Lip ids to f f wechsel 

Steroidhormonsynthese 

Steroide werden in spezialisierten Zellen der Nebennieren, Ei- 
zellen, Hoden, Placenta und im Gehirn synthetisiert . Sie sind 
essentiell fur die Auf rechterhaltung der normalen Korper- 
homoostase. Die Synthese aller Steroidhormone beginnt mit der 
Lwaiidlung von Cholesterol in Pregnenolon. Dies ist der erste 
.zymatische Schritt, der an der Matrix der innermitochondria- 
en Membran erfolgt. 




Das Steroidogenic Acute Regulatory Protein (StAR) spiel t eine 
Schliisselrolle im Transport von Cholesterol von der auSeren 
zur innermitochondrialen Membran. Dieser Transport ist der ra- 
tenlimitierende Schritt in der Steroidogeneses Mutationen im 
StAR-Gen verursachen die potentiell lethalen Bedingungen, die 
als congenital lipoid adrenale Hyperplasie bekannt sind. Glei- 
che Beobachtungen konnten an StAR- Knock- out Mausen gemacht 
werden (131) . 
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StAR- Express ion kauri durch Agenzien positiv und negativ regu- 
liert werden, die vorwiegend am Promotor wirken. Die hormon- 
stimulierte Steroidsyntliese ist begleitet von einem schnellen 
Anstieg der StAR-mRNA- Spiegel . cAMP hat einen positiven und 
schnellen Effekt auf den Anstieg der StAR-mRNA, scheint aber 
nicht direkt an der Promotorsequenz zu wirken. 

Der erste Transkriptionsf aktor als potentieller Regulator des 
StAR- Gens war der Steroidogenic factor 1 (SF 1) , auch Orphan 
Nuclear Rezeptor Transkriptionsf aktor genannt. 

•StAR- Promotor besitzt verschiedene Consensus- 
dungs sequenz en fur SF 1. Zwei von diesen an Position -97 
und -42 sind hoch konserviert. Eine weitere an Position -132 
wurde nur in Mausen und Ratten gefunden. 

Ein weiterer Kandidat ist das CCAAT/enhancer Bindungsproteine 
(C/EBPs) , ' das zur Familie der bRegi on/ leucine zipper Tran- 
skriptionsf aktoren gehort. Zwei Mitglieder dieser Familie wer- 
den in steroidogenen Zellen exprimiert (C/EMPa und C/EMPP) . 
Der StAR-Promotor hat zwei mogliche Bindungssstellen fur 
C/EMP. SF 1 und C/EMP bilden einen Komplex am StAR-Promotor. 

M M owohl der humane als auch der Ratten-StAR-Promotor besitzt 
^^^Pweiterhin Bindungsstellen fiir SREBP-la (Sterol regulatory ele- 
ment binding protein- la) . SREBP-la ist ein bedeutender Aktiva- 
tor fiir den StAR-Promotor. 

Weitere Transkriptionsf aktoren wie SF 1, NF-Y, YY1, und SP1 
sind in die Wirkung von SREBP am StAR-Promotor involviert . 
SREBP-la reguliert koordinierend zusammen mit den anderen Fak- 
toren den StAR-Promotor. 

CREB kann ebenfalls binden und auf schnelle Weise die Tran- 
skription aktivieren (cAMP Bindung) . 
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DAX-1 bindet direkt an der Hairpin- Struktur des StAR- Promo tors 
sowie direkt an SF-1 und inhibiert in beiden Fallen deren Ex- 
pression (131) . 

Wenn SREBP-la eine koordinierende Rolle in der Bereitstellung 
von Cholesterol in der Steroidliormonsynthese ubernimmt , kommt 
ihm eine essentielle Bedeutung in der Qiolesterolhomoostase 
zu. Der StAR-Promotor der Ratte besitzt 5 sogenannte SRE- 
Bindungsstellen (Sterol Regulatory Element) , an die die akti- 
/ vierte Form, von SREBP-la binden und die Transkription aktivie- 

•kann (132) . Eine weitere SRE-Bindungss telle wurde im huma- 
StAR-Promotor gef linden, an die sowoh.1 SREBPrla als auch 
YY1 -binden kann und bedingungsabhangig bei hohen Konzentratio- 
nen von SREBP-la aktiv ist (133) . 

SREBPs gehoren zur Familie der basic helix-loop-helix leucine 
- zipper (bHLH-Zip) Transkriptionsf aktoren, die als 125 kDa mem- 
brangebundene Precursor- Pro teine im endoplasmatischen Retiku- 
lum synthetisiert werden und bei Sterolmangel in der Zelle 
durch enzymatische Abspaltung der 68 kDa N- terminal en, die 
bHLH-Zip Domane entba.ltenden Region des Proteins aktiviert 

•erden und in den Nucleus einwandern. Dort binden sie spezi- 
isch an die DNA-Sequenz von SRE (sterol regulatory element) 
nd aktivieren die Transkription ihrer Zielgene (134, 135) . 

Es wurden bisher drei SREBPs beschxieben, die SREBP-la, SREBP- 
lc und SREBP-2 genannt werden. SREBP-la und -lc werden vom 
gleichen Gen unter Nutzung alternativer Promotoren exprimiert. 
SREBP-2 wird von einem separaten Gen exprimiert (135, 142). 

Cholestolgene, die klassische SRE-Bindungsstellen in ihxen 
Promotoren besitzen, werden stark und effektiv von SREBP-la 
und SREBP-2 aktiviert. SREBP-lc ist inaktiv fur diese Bin- 
dungss tellen . 
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. SREBP-lc, auch ADD 1 genannt, weist eine Besonderheit auf. Es 
bindet an E- Boxen (universelle cis-Elemente fiir bHLH- 
Proteine) . Damit weist es eine duale Bindungsspezif itat zu 
beiden, .den klassischen palindromen E-Boxen und den nonpa- 
lindromen SREs, auf. Diese einmalige Bindungsspezif itat ist 
auf den Thyrosinrest in der basischen Region zuruckzufiihren, 
der einmalig fur die SREBP-Familie ist, denn alle bekannten 
bHLH- Proteine besitzen an dieser Position Arginin (136) . Die- 
ser Austausch zerstort die Transaktivitat aller SREBPs fur 
SRE-Bindungsstellen, erhoht aber markant die Aktivitat von 

•BP-1 fur Bindung an E-Boxen (siehe SREBP-lc) aber auch von 
BP-2. Dieses ist jedoch inaktiv und aktiviert das Zielgen 
nicht (13 6) . 

Die SREBPs sind unterschiedlich starke Transkriptionsf aktoren 
und benotigen meist Cof aktoren. Solche sind NF-Y, SP1, CBP 
(CREB-Bindungsprotein) . 



SREBP-Zielgene werden in 2 Gruppen eingeteilt (136) : 

•Cholesterol-Biosynthese-Gene 

• HMG-CoA- synthase und -reduktase 

• Farnesyl-diphosphat synthase 

• Squalensynthase 

• SREBP-2 • 

• LDL-Rezeptor 

• HDL-Rezeptor (137) 

Alle enthalten die klassische SRE-Sequenz (ATCACCCCAC) 
oder das SRE 3 Motif (CTCACACGAG) und angrenzende Cofak- 
tor-Bindungsstellen fur NF-Y oder SP1 in ihren Promotoren. 



• Lipogene Enzym-Gene 
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Sind nahrungsreguliert auf der Transkriptionsebene 
( z . B . Glukose , Insulin) 

• Acetyl - CoA- Carboxylase 

• Fettsauresynthase (FAS , erhoht TG) 

• Steryl- CoAdesaturase 1 und 2 

• Glycerol - 3 -pbosphat-Acyltransf erase 

• Diacepam-binding Inhibitor (Acyl-CoA-Bindungsprotein) 

• Spot 14 (Leberenzym S 14) 

Die SREBP-Bindungs- und -Aktivierungsstellen in den Pro- 
motoren dieser Gene scheinen sich von den klassischen 
SRE- Consensus - Sequenzen zu unterscheiden und werden als 
SRE - 1 ike - Sequenz en bezeichnet. 



Einige weitere Enzyme wie Liver - Type - Pyruvatkinas e (PK) und 
Glukokinase (GK) enthalten E-Box oder E-Box-like Sequenzen im 
Promotor, was bedeuteii kann, daS sie Kohlenhydrat , Glukose- 
und Insulin- sens itiv sind und potentiell SREBP-Targets sein 
konnen . 



lie: 

ft: 



Alle aktiv wachsenden Zellkulturen produzierten predominant 
SREBP-la und SREBP-2, wogegen die meisten Organe ' einschlieS- 
lich Leber von adulten Tieren SREBP-lc und SREBP-2 produzie- 
Alle SREBPs sind in der Lage, jedes der bekannten Zielge- 
zu aktivieren, jedoch mit unterscbiedlicher Effizienz. 
SREBP-lc ist schwacher (kurzere Transaktivierungsdomane) als 
SREBP-la und SREBP-2 . 



Die spezifische Rolle der SREBP-Isof ormen in vivo wurde in 
transgenen Mausen untersucht Die differente Uberexpression er- 
gab, daS die SREBP-l-lsof ormen selektiv die Fettsaurebiosyn- 
thesegene aktivieren und SERBP-2 spezifisch die Cholesterol - 
biosynthese kontrolliert . 
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SREBP- la unci -1c spielen eine groSe Rolle in der nahrungsab- 
hangigen Induktion hepatisch lipogener Enzyme und der Chole- 
sterogenese. SREBP-2 dagegen bestimmt die Sterolregulation 
durch Abbau des membrangebundenen Precursor- Proteins, urn die 
aktive Form fur die Einwanderung in den Nukleus bereitzustel- 
len. SREBP-1 kontrolliert lipogene Enzyme durch Selbstregula- 
tion seines eigenen Transkriptions levels . 

Der Fakt, daS die SREBPs relativ schwache Transkriptions fakto- 
ren sind uiid Cofaktoren benotigen, wurde bereits erwahnt. Ben- 
nett et.al. (13 8) zeigten beispielsweise, daS die Aktivierung 
tor SREBPs durch Sterolmangel in vivo in einer erhohten Bin- 

mv43^^ V ° n SP1 3X1 eilier ' 3X1 die SREBP -Bindungss telle angrenzen- 
den Seguenz im Promotor fur das LDL-Rezeptorgen bindet. Ahri- 
lich werden die zwei coregulierenden Faktoren NF-Y und CREB 
(cAMP Responsive Element Binding Protein) verstarkt an den 
Promotor von HMG CoA-Reduktase gebunden. SREBP- Aktivierung er- 
hoht die Histonacetylierung von H 3, nicht aber von H 4 im 
Chromatin beider Promotoren ( HMG- CoA- Synthase und -Reduktase) . 
Die Resultate zeigen, daE feine Differenzen im Muster der 
Kern-Hi st on- Ace tylierung eine Rolle in der selektiven Genakti- 
vierung spielen. Das zeigt, daS die Bindung der Transkripti- 
^£fens faktoren an die DNA eine notwendige, aber nicht ausreichen- 
)fa le Bedingung fur die Transaktivierung ist (13 8) . 

SREBP-1 kann einige andere E-Box oder E-Box-like-Sequenzen im 
FAS-Promotor und im S14 -Promotor aktivieren, ist aber vollig 
inaktiv ftir degenerierte E - Box - S equenz en z.B. im PK Promotor, 
Promotoren mit SRE-Bindungsstellen benotigen unbedingt NF-Y 
Oder SP1 als Cofaktoren fur die SREBP -Aktivierung. SREBP-1 hat 
eine wesentlich hohere Affinitat und ist effizienter in der 
Aktivierung von SRE enthaltenden Promotoren als von E-Box ent- 
haltenden Promotoren. 
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In lipogenen Enzymen, die Promotoren mit SRE- 1 ike - Sequenz en 
enthalten, aktivieren alle Isoformen von SREBP die Transkrip- 
tion (SREBP-la starker als SREBP-lc, SREBP-la bevorzugt gegen- 
uber SREBP-2) . Die Bindung der SREBP -Isomer en an die verschie- 
denen Bindungsdominen der Genpromotoren (13 6) ist in Fig. 6 
dargestellt . 

Einf luS von YY1 auf die Regulation der lipogenen Gene 

YY1 ist bekannt als Transkriptionsmodulator , der sowohl als 
Enhancer und Repressor aber auch als Initiator-Bindungsprotein 

•ken kann, was von- der Herkunft der Zelle und den Bindungs- 
lleri des Promotors abhangig ist. YY1 ist auch in der Lage, 
den gleichen Promotor zu aktivieren und zu hemmen, wenn das 
intrazellulare Milieu verandert ist, das Bindungselement im 
Promotor mutiert (verandert) ist, oder die Bindungsstelle um- 
gebende DNA-Sequenz alteriert ist. 

In Hinblick auf die betrachteten Gene lassen sich folgende 
Einflusse von YY1 folgern. 

YYl besitzt eine hohe Affinitat zu SREBP-la. Im StAR- Promotor 

•befindet sich eine YYl-Bindungss telle, die mit der proximalen 
Bindungsstelle fur SREBP-la uberlappt. Die gleichzeitige Bin- 
dung von SREBP-la und YYl am StAR-Promotor reprimiert dessen 
Trans kripti on . Dieser Fakt beeinfluSt wiederum den Chole- 
steroltransport und somit die Steroidhormonsynthese . 

YYl wirkt als Aktivator spezifischer Repressor, korikurriert 
mit den Bindungsstellen der SREBPs und deren Cofaktoren bzw. 
behindert sterisch die Bindung der SREBPs z.B. an SREs der 
lipogenen Gene. Er wirkt sowohl als Typ- I -Repressor (Bindung 
an Cofaktoren, Komplexbildung) als auch als Typ-II-Repressor 
(direkte Bindung an die DNA, sterische Blockierung von Bin- 
dungsstellen) . Durch Mutation der Bindungsstelle in YYl konnte 
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nachgewiesen werden, daS die SREBP-la Akti vie rung des StAR- 
Proniotors um ein Vielf aches anstieg, Untersuchungen an trans - 
fizierten HepG2 Zellen ergaben, dafi YY1 Mutant en (YY A 296- 
331, YY A 399-414, YY A 334-414 oder YY A 154-199) z.B. die 
sterolaktivierte Expression des LDL-Rezeptor xind FPPS- 
Rezeptors nicht reprimierte . Die Mutationen YY A 334-414 oder 
YY A 154-199 verhindern die nukleare Lokalisation, die DNA- 
Bindung und die Interaktion mit CBP. YY A 296-331, YY A 3 99- 
414 Waren inaktiv bei der Repression der SREBP-la abhangigen 
Induktion der Expression des HMG-CoA Synthase -Promotors (134) . 

•jlreiche weitere Promotoren der sterolregulierten Gene ent- 
ten potentielle Bindungsstellen fur YY1 (CCAT oder ACAT) 
uberlappend oder angrenzend an Bindungsstellen der Coaktivato- 
fcen bzw. Transkriptionsaktivatoren. Diese konnen durch YY1 
verdrangt oder blockiert und damit die Genexpression repri- 
miert werden (vgl . Fig, 7). 

Nach dem gleichen Prinzip werden auch die anderen Promotoren 
durch YY1 reprimiert. 




HDL-Rezeptor ► positiv reguliert durch SREBP-la plus SP1 oYYl (Repr.) 

L-Rezeptor ^ positiv reguliert durch SREBP-la plus SP1 OYY1 (Repr.) 

Fettsauresynthase 

Farnesyl Synthase ^ positiv reguliert durch SREBP-la plus NF-Y <-» YYl(Repr.) 

HGM-Co A Synthase 



HGM-CoA-Reduktasegenexpression wird durch. YY1 nicht re- 
primiert . 

Der Synergismus der Bindung von SREBP und NF-Y bzw. SP1 an 
Promotoren der SREBP -responsiven Gene, einschlieSlich SREBP-2, 
fuhrt zur Aktivierung der Transkription, die die Cholesterol- 
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homoostase (LDL-Rezeptor , HDL-Rezeptor, HMG-CoA-Syntha.se und - 
Reduktase, FPP (Faraesylphosphat) -Synthase, Sgualensynthase) 
die Fettsauresynthese (Fettsauresynthase und AcetylCoA- 
Acetylase) , den Fettsaureabbau (Stearyl-CoA-Desaturase) und 
die Triglyceridsynthese ( Glycerol- 3 -phosphat- 

Acetyltransf erase) kontrolliert (134) . 

YY1 kann uber die o.g. Mechanismen in diese Prozesse eingrei- 
fen. YY1 kann auch durch Interaktion mit SREBP-la die Erken- 
nung der Domane auf SREBP-la fur die RNA- Polymerase -II behin- 
dern und damit die Transkription reprimieren, was einen weite- 




regulatorischen Mechanismus der Transkriptionsregulation 
Istellt (134) . 



Beeinflussung der SREBP Aktivierung bei verschiedenen Erkran- 
kungen 

In hepatischen Zellen wird vorwiegend SREBP-lc exprimiert, das 
in diesen Zellen auch durch. Glukose und Insulin sowohl auf 
mRJSTA als auch auf Proteinebene stimuliert wird (13 9) . 

Bei experimentellem Streptozotozin-Diabetes von Ratten wurde 
eine massive Erhohung der Expression von SREBP-la und Fettsau- 
resynthase gefunden. Daraus result ierte eine starke Triglyce- 
■idakkumulation (TG) . Behandlung mit Insulin konnte beides 
senken. In Nierenzellen war bei hoher Glukose die Expression 
von SREBP-la und ~lc mRNA und Proteinsynthese erhoht ebenfalls 
die Fettsauresynthese und damit die TG-Akkumulation. SREBP- 1- 
Expression ist bei Diabetes mellitus erhoht. SREBP- 1 spiel t 
eine bedeutende Rolle in der Erhohung der Lipidsynthese, TG- 
Akkumuka t i on , mesangialen Expansion, Glomerulosklerose und 
Proteinurie, indem es die Expression von TNFp und des vaskula- 
ren Endothelwachs turns -f aktors erhoht (140) . 
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Bei Typ-2-Diabetikern wurde eine signifikante Verminderung der 
•SREBP-1 -Express ion im subkutanen Fettgewebe und im Skelettmus- 
kel gefunden. Ex vivo konnte dieser Effekt durch TNFoc behoben 
werden (141) . 

Daher kann durch Auf - bzw. Abregulation von YY1 der Li- 
pidstof fwechsel entsprechend beeinfluSt werden. 



Nutzung der Erkenntnisse 
^^H^^)iagnostik 

DNA-Sequenz und Genexpression 

Ausgehend von der vorliegenden YY1 Seguenz werden unter Ver- 
wendung der in Fig. 11 aufgefiihrten Primer Sequenzanderungen 
in YY1 zur Diagnose von moglichen Fehlleistungen genutzt. Dazu 
wird genomische DNA und ssDNA aus mononuklearen Blutzellen rait 
den Primem amplif iziert und sequenziert bzw. Punktmutations- 
analysen (SNPs) durchgefuhrt (vgl. Kwok P.Y. SNP genotyping 

^^with fluorescence polarisation detection. Hum. Mutat. 19, 

Ifa W 002 ' 315-323) . 

Daruber hinaus wird RNA aus mononuklearen Blutzellen und Gewe- 
be durch.. Biopsie (Muskel, Fettgewebe, Haut) bzw. durch Punkti- 
on von Niere und Leber gewonnen, umgeschrieben in ssDNA und 
sequenziert (Umschreibung in ssDNA) sowie zur Genexpressions- 
analyse eingesetzt, wie unter Pkt. Genexpression beschrieben 
. (vgl. S 23) . Es wird davon ausgegangen, daE in den Geweben un- 
terschiedliche Express ionsmuster und auch SpleiSvarianten (s. 
verkiirzter Zinkfinger bei BB . 6S in Leber, Pankreas und Hirn) 
auftreten konnen und wichtige Hinweise zur Regulation von YY1 
in den Geweben und zur Erkrankung geben. Diese Gewebe kommen 
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in Betracht, da beim Typ-1 -Diabetes diabetische Folgeerkran- 
kungen auftreten konnen, die sich in verschiedenen Geweben ma- 
nifestieren (diabetische Nephropathie, Retinopathies Neuropa- 
thie etc.). Folgeerkrankungen sind u.a. Fettstof fwechselsto- 
rungen (Fettgewebe, Leber) , Bluthochdruck (Niere) , Herz- 
Kreislauferkrankiingen (Muskelgewebe) aber auch dermatologische 
Erkrankungen (Haut) . Da nicht alle Diabetiker gleichermaEen an 
alien Folgeerkrankungen leiden,wird erwartet, daS das Expres- 
sionsprofil von Proband zu Proband unterschiedlich ist. 

ELISA (Enzyme- linked immunosorbent assay) 

VftV/iW serol ogisch.e Tests zur Diagnostik durchfuhren zu konnen, 
Tcann die Sequenz genutzt werden, urn verschiedene ELISA- 
Verfahren zu etablieren. Dafur werden monoklonale und polyklo- 
nale Antikorper erzeugt. 

Herstellung von polyklonalen und monoklonalen Antikorpern 
(s. Ref. 89) 

Es werden erf indungsgemafi polyklonale Antikorper gegen YY1 
hergestellt. Zur Erzeugung konnen Kaninchen gfcnutzt werden. 

M* 3 Protein YY1, synthetisch hergestellt und individuell fur 
f ^ en Probanden, wird mit einem sogenannten vollstandigen 
Freundschen Adjuvans versetzt. Das Adjuvans schiitzt das Prote- 
in YY1 vor der Degradierung . Das Freundsche Adjuvans besteht 
aus einer Mischung von Paraffinol und Manidmonooleat , der in- 
aktivierte und getrocknete Tuberkulosebakterien (Mycobacterium 
tuberculosis) zugesetzt wurden. Dies bewirkt im Tier eine all- 
gemeine Immunreaktivitat , die primare Immunantwort. Das Ge- 
misch wird intradermal, subkutan oder intramuskular ins Kanin- 
chen injiziert. Nach ungefahr vier bis sechs Wochen wird das 
gleiche Protein mit inkompletten Adjuvans (Bakterien fehlen) 
erneut injiziert, urn eine sekundare Immunantwort auszulosen. 
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In Abhangigkeit vom Antikorpertiter wird das Tier entblutet 
und das Antiserum gewonnen. 

Fur die Herstellung monoklonaler Antikorper (mAK) wird die von 
Kohler und Milstein entwickelte Hybridoma-Technik angewandt. 

Mause werden mit dem YY1- Protein, daS in Abhangigkeit von der 
DNA-Sequenz des Probanden synthetisch hergestellt wird, immu- 
nisiert. Die antikorperproduzierenden Milz-Lymphozyten werden 
anschlieSend in Kultur mit Myelomzellen (Krebszellen) fusio- 
niert in Anwesenheit von Polyethylenglykol . Nach Fusionierung 
den die sogenannten Hybridome in Mikrotitertestplatten (0,2 
olumen) verteilt und mit dem HAT (Hypoxanthin-Aminopterin- 
tymidin) -Selektionsmedium kultiviert. Das Medium gewahrlei- 
stet,' daS nur Hybridome wachsen. Nach 10 Tagen Kultur werden 
die Hybridome vereinzelt und in Kultur weitervermehrt . Die mAK 
werden aus den Zellkulturuberstanden isoliert. 

Reinigung der Antikorper (Aff initatschromatographie) (s, Ref. 
89) 



Thym: 



• 



Da Antiseren nebeii den spezifischen Immunglobulinen, die gegen 
1 gerichtet sind, noch weitere Antikorper enthalten, soli 
tLttels einer Aff initatschromatographie die Auf reinigung er- 
olgen. YY1 wird dabei an eine feste Matrix gebunden. Nur An- 
tikorper, die spezifisch gegen YY1 gerichtet sind, binden. Al- 
le anderen Antikorper passieren die Saule. Die spezifischen 
Antikorper werden durch pH-Wert Veranderung (auf 2,5 oder uber 
11) von YY1 eluiert. 

Diese spezifisch auf gereinigten Antikorper gegen YY1 konnen 
dann in weiteren Schritten im ELISA-Verf ahren oder Western 
blot genutzt werden. 
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Gegenstand der vorliegenden Erfindung sind daher auch Antikor- 
per, die gegen ein vorgenanntes Protein oder Peptid der Erfin- 
dung gerichtet sind. Vorzugsweise handelt es sich bei den An- 
tikorpern vim monoklonale Antikorper. 

In diesem Zusammenhang dienen auch Sandwich-ELISA zum Antigen- 
nachweis, und geeignet ist auch der Nachweis spezifischer An- 
tikorper gegen ein Antigen mittels enzymmarkierten Sekundaran- 
tikorpern. 

Etablierung der ELI SA-Ver £ ahren (s. Ref. 89) 



• 



iweis spezifischer Antikorper gegen YY1 mittels enzyramar- 
erten Sekundarantikorpern 

Synthetisch hergestellte YYl-Proteine werden an einen festen 
Trager (Kunststof f oberf lachen, Mikrotiterplatte) gekoppelt . 
AnschlieSend wird das zu untersuchende Probandenmaterial (Se- 
rum) uberschichtet . Spezifisch gegen YY1 gerichtete Antikorper 
im Serum befindlich, binden. Ungebundene Komponenten werden 
heruntergewaschen. Mittels eines Sekundarantikorpers, chemisch 
mit einem Enzym markiert, wird in der Farbreaktion das Sub- 
trat umgewandelt . Anhand eines mitgef uhrten Standars kann 
'ann, nach Erstellung der Eichkurve, direkt mit der Antikor- 
erkonzentration korreliert werden. 



Sandwich- ELISA (Antigennachweis) (s. Ref. 89) 

Die Antikorper, spezifisch gegen YY1 gerichtet, werden an ei- 
nen festen Trager (Kunststof f oberf lachen, Mikrotiterplatte) 
gebunden. Im AnschluS daran wird das Probandenmaterial uber- 
schichtet. Die YYl-Proteine binden spezifisch an den Antikor- 
per. Ungebundene Komponente werden heruntergewaschen. Mittels 
monoklonaler Antikorper und eines Anti-Antikorpers (Enzymmar- 
kiert) wird die Menge an YYl-Proteinen ermittelt. 
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Westernblot (s. Ref. 144) 

Es wird davon ausgegangen, dag zwischen den Probanden, bedingt 
durch alternatives Splei&en oder bereits genetisch bedingt, 
sich die YYl-Proteine in ilirer GroSe (Molekulargewicht) unter- 
scheiden. 

Daher kann mit Hilfe einer SDS-Polyacrylamid-Gelelekrophorese 
(SDS-Page) YYl-Proteine nach ilirer GroSe aufgetrennt werden. 
Durch das SDS erhalten die Proteine negative Ladungen (SDS- 

•dung) . Nach dem gelelekrophoretischen Lauf wird das Trenn- 
auf eine immobilisierte Membran (Nitrozellulose) transfe- 
rxert. Mittels spezifischer Antikorper gegen YY1 gerichtet und 
Alkalischer Phoshatase werden die Proteine angef arbt . 

Gegenstand der Erfindung ist somit ein Verfahren zur Bestim- 
mung der Neigung, 'an Typ-1 -Diabetes zu erkranken, bei dem man 
genomische DNA aus isolierten mononukleare Blutzellen amplifi- 
ziert, sequenziert und man Anderungen oder Abweichungen der 
Nukleinsauresequenz, die fur ein Protein mit der in SEQ ID 
NO: 6 dargestellten Aminosauresequenz kodiert, bestimmt, wobei 

»ine Abweichung der Codons fur die Amino saur en an Position 3 06 
ad/ oder 314 eine erhohte Neigung, an Typ-1 -Diabetes zu er- 
ranken, anzeigt. 

Weitere Mutationen, die auf hohere Diabetesneigung hindeuten 
konnen, liegen in folgenden Sequenzbereichen und. lassen sich 
unter Verwendung folgender Primer nachweisen: Intron 4: Pri- 
mer: K815-F/K817-R; K815-P/K875; K821-F/K817-R; K821-F/K870- 
R; K874-F/K870-R. Zur Amplif ikation verwendet man vorzugsweise 
die Primer K823 -F/K825-R; K884-F/K806-R; K801-F/K804 -R; K814- 
F/KK832-R; K828-F/K833-R; K831-F/K817-R; K815-F/K870-R; K815- 
F/K818-R; K816-F/K819 -R; K834-F/K836-R, F15/R12; F15/R14 ; 
F15/R13; F57/R16; F57/R20; F57/R21; F59/RR25; F59/RR30; 
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; 



F59/R33; F95/RR34; F96/R39; F95/R48; F95/R50; F60/R7; F60/R8; 
F60/R66; F60/R67; F96/R76; F96/R77; F96/R81 F96/R83; F33/R1; 
F33/R4; F33/R15; F39/R28; F40/R3; F41/R5; ocier andere Kombina- 
tionen. 

Ferner eingesehlossen ist ein Verf ahren zur Bestimmung der 
Neigung, an Typ- 1 -Diabetes zu erkranken, bei dem man RNA aus 
isolierten mononukleare Blutzellen oder Gewebsbiopsien (Fett- 
gewebe, Muskelgewebe , Haut) - bzw. Gewebspunktionen (Leber, 
Niere) isoliert, amplifiziert und quantif iziert, wobei eine 
erhohte/verminderte Expression eine erhohte/verminderte Nei- 
g, an Typ-1 -Diabetes zu erkranken, anzeigt. (vgl. oben zu 
^expression 1 , Seite 22) 



2. Behandlung 

2.1 Nutzung von DNA oder Antisense 

Zur Abregulation von YY1 soil DNA oder Antisense von der vor- 
liegenden Sequenz mittels PCR erzeugt und appliziert werden. 
Sowohl DNA als auch Antisense-Oligonukleotide werden modifi- 
iert, urn ihxe Stabilitat gegenuber den meisten Exo- und Endo- 
ukleasen zu erhohen. (Jansen, B. and U. Zangemeister- 
ittke. Antisense therapy for cancer- the time of truth. Lancet 
Oncol. 3, 2002, 672-683). Die Applikation der stabilisierten 
DNA oder Antisense erfolgt subkutan (s.c.) oder int ramus kular 
(i.m.). Die Dosis richtet sich nach der individuellen Expres- 
sion von YY1, die in bestimmten Abstanden gepruft werden soli, 
urn eine ausgewogene Balance von YY1 im Hinblick auf andere Ge- 
ne zu err ei chen. 
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Antisense Oligonukleotide 

Da die Antisense Oligonukleotide eine bobe Spezifitat besit- 
zen # konnen sie spezifisch binden, die RNA blockieren und so- 
mit die Expression verhindem. Die Antisense Oligonukleotide 
sollen im Abstand von 2 bis 20 Basen uber die Sequenz verteilt 
werden. Dabei wird vorzugsweise bei Position 73 begonnen. 

Wichtige Fragmente, bei denen mehrere Antisense- 
Oligonukleotide hergestellt wurden (immer urn eine Position 
verschoben) , sind: 73 bis 564, 565 bis 717, 718 bis 834, 835 
^■j^ 1071; 955 bis 999, 955 bis 1041, 1000 bis 1041, 1042-1125, 

W'iJP 9 biS 1848 ' 1849 bis 1938 ' 967 bis 1:L 25, 1071 bis 1938 so- 
^^me die Intronsequenz 1126-1758. Die PCR-Amplif ikation erfolgt 
wie beschrieben (12) . 

Oligonukleotid-Modifikationen 

Zur Verbesserung der a Ef f izienz/Stabilitat mit Hilfe von: 

1 . ) Methylphosphonaten 

2 . ) Phosphorothioaten 

^j^- Nuclease-resistent, wasserloslich, starke Hybrydisierung mit 

w m m " RNA 

steigert RNase H Aktivitat, die verantwortlich ist fur den 
Abbau von m-RNA im Doppelstrang 

3 . ) Pbospbodithionate 

4. ) Polyamid-Ruckgrat (PNA-DNA-Cbimare) statt Pentose- 
Phosphat (Uhlmann E.,-Peyman A., Breipohl G . , Angew. Chem. 
1998, 110, 2954-2983.) 

- Cbimare besser fur die Zellaufnahme 

Verbesserung der Transporteigenschaf ten mit Hilfe von: 
1.) Alkylierung (Hydrophobie erhoht) 
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2 . ) Kopplung an Zucker ■ 



•f 
h 



Ribozyme 

Ribozyme sind katalytische RNA ,mit enzymatischen ' Eigenschaf - 
ten ( Phosphates ter-Hydrolyse; Nobelpreis Cliech/Altmann) . Ribo- 
zyme. erkennen bestimmte Basensequenzen in cier mRNA und zer- 
schneideii das Molekul an diesen .Stellen. Sie haben detnnach ei- 
ne Doppelfunktion, das Erkennen einer bestimmten - Struktur, 
dann hydrolytische Spaltung einer Phosphordiesterbindung an 
einer bestimmten .Stelle. Zwei Klassen von Ribozymen haben be- 
aidere Bedeutung. Solche - mit einer hammer formigen ( "hammer - 
.d n ) -Struktur und piridere, die eine Haarnadel ( "hairpin" ) - 
truktur aufweisen. Die von den Ribozymen entwickelte Endonu- 
kleaseaktivitat kann praktisch gegen alle RNA- Struktur en wirk- 
sam werden. 

Triple-Helix-Bindung 

Daruber hinaus soil ein dritter Nukloetidstrang an eine DNA- 
Doppelhelix xiber zusatzliche (Hoogsteen-) Basenpaarung gekop 7 
pelt werden. Damit entsteht. ein Stuck eines Dreif achstranges, 
^das nicht- mehr transkribiert werden kann.' Die Positionen in 
er DNA sind abhangig von der Sequenz struktur des Probanden. 
aqhteil: Erkennnung nur in Purin-reichen Regionen 




Gegenstand der Erf induing ist daher auch die Verwendung einer 
vorgenannten - Nukleinsaure- ' oder eines Antisehse-Oligonuklebtids 
zur- Herstellung einer pharmazeutischen Zusammensetzung. 

Ferner betrif f t die Erf indung- eine pharmazeutische ' Zusammen- 
setzung, die eine vorgenannte Nukleinsaure oder ein Antisense- 
Oligonukleotid sowie gegebenenf alls zusatzliche, pharmazeu- 
tisch vertragliche Hilfs- und/ oder Tragerstoffe enthalt. Die 
Zusammensetzungen .sind vorzugsweise in einer zur ' intravenosen 
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(i.v.), subcutanen (s.c.) oder intramuskularen (i.m.) Applika- 
tion geeigneten Form formuliert. 

2.2 Nutzung des Proteins 

Das Protein YY1 oder Peptide desselben werden synthetisiert, 
urn appliziert werden zu konnen. Bevorzugte AS- Fragment e sind: 
1 bis 165, 166 bis 215, 216 bis 254, 255 bis 323, 255 bis 302, 
255 bis 309 (mit und ohne Mutation) , 310 bis 323 (mit und ohne 
Mutation), 324 bis 351, 352 bis 381, 382 bis 411. Daruber hin- 
* ^FMP S wird d ®r verkurzte BB.6S- Bereich von 299 bis 351 bevor- 
fl H^' In d iesem Zusammenhang kann die fur ein Protein mit der 
^^^n SEQ ID NO: 6 kodierende Nukleinsauresequenz , insbesondere 
die Sequenz gemaS SEQ ID NO: 5, oder Fragmente derselben in ei- 
nen Expressionsvektor eingebracht und unter Bedingungen expri- 
miert werden, die fur das gewahlte Vektorsystem geeignet oder 
vorteilhaft sind. Entsprechende Verfahren sind dem Fachmaxm 
wohlbekannt . 

Dabei stehen Modif ikationen des Proteines oder der Peptide 
durch: 

•a) Acetylierungen 
b) Deacetylierungen 

c) Methyl ierungen 

d) Phosphoryl ierungen 

e) O- und N- Glykosylierungen 

im Vordergrund, urn Stabilitat und Aktivitat zu erhohen. 

Die Erfindung betrifft somit auch die Verwendung eines oder 
mehrerer der oben genannten Proteine und/oder Peptide zur Her- 
stellung einer pharmazeutischen Zusammensetzung. 
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Einges chlos sen sind ferner pharmazeutische Zusammensetzungen, 
die ein oder mehrere der oben genannten Proteine und/oder Pep- 
tide enthalten, wobei die Proteine und Peptide gegebenenf alls 
wie oben beschrieben modif iziert sind. Die Zusammensetzungen 
enthalten gegebenenf alls zusatzliche, pharmazeutisch vertrag- 
liche Hilfs- und/oder Tragerstof f e und sind vorzugsweise in 
einer zur intravenosen ( i . v . ) , subcutanen ( s . c . ) oder intra - 
muskularen (i.m.) Applikation geeigneten Form formuliert. 

Sp 1 ei£ var i ant en 



ruber hinaus konnen alle moglichen SpleiSvarianten (s. un- 
) mit Hilfe der im Rahmen der Erfindung untersuchten Se- 
enz erfaSt werden, um verschiedenste Proteine erzeugen zu 
konnen. Die SpleiSvarianten unterschiedlicher Grofie sind nach.- 
folgend aufgezeigt. Diese Proteine wer den vorzugsweise wieder- 
um modif iziert (s. oben), um einen spezifischen Einsatz zu er- 
moglichen. Sie konnen entweder einzeln auch in Kombination 
eingesetzt werden. 

Potentielle SpleiSvarianten (http: //www. itba.mi . cnr . it) 



J)ONOR SITES: 








Position 


EXON 


INTRON 


SCORE 


1 157 


GAG 


GTGGAG 


78. 


" 379 


GAG 


GTGATT 


85. 


406 


GAG 


GTAGTG 


81. 


409 


GTA 


GTGGGT 


81. 


475 


CCG 


GTACCC 


75. 


668 


CGG 


GTAATA 


80 . 


694 


CAG 


GTGCAG 


78 . 


1129 


CAG 


GTAGAG 


79. 


1172 


CTG 


GTCAGG 


83 . 


1214 


GGG 


GTATTT 


73 . 


1273 


CAG 


GTGTTA 


77. 


1363 


GTA 


GTGAGT 


80. 


1370 


GTA 


GTGTGT 


72. 


1423 


CAG 


GTGACA 


84. 


1453 


CTC 


GTGAGT 


79. 


1605 


CCA 


GTGTGT 


78. 


1671 


ATA 


GTAGGT 


80. 



60 



1675 



TAG GTGGTT 



77. 



1693 



GCA GTGAGC 



79. 



2172 



AAG GTGTTT 
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ACCEPTOR SITES : 



POSITION 


INTRON EXON 


SCORE 


31 


CTCCCGCAG CCCA 


87 . 


36 


GCAGCCCAG GAGC! 


85 . 


335 


GCGCTGCAG CCGC 


78 . 


747 


GGTCTTCAG ATGA 


80. 


882 


ACCTCTCAG ACCC 


80. 


1036 


CGGTCCCAG AGTC 


78 . 


1053 


TCTGTGCAG AATG 


77 . 


1274 


GGACTGCAG GTGT 


80 . 


1333 


TTCTAGCAG GTTT 


79. 


1365 


GTTTTGTAG TGAG 


80. 


^ 1418 


TGGCTACAG CTCC 


77. 


^ 1424 


CAGCTCCAG GTGA 


81. 


m 1447 


TGCTTATAG AAGA 


80. 


™ 1510 


ACTTCCTAG AGTG 


81. 


1572 


TTTCTCAAG AACT 


84. 


1713 


GATCCCCAG GTTC 


80. 


1734 


TTTGCCAAG AGGG 


78. 


1763 


CCTTGACAG TGCA ' 


85. 


1989 


CCTCTTCAG GAGT 


79. 


2037 


TATTTCTAG GAAG 


83. 



Die SpleiSvarianten wercien durch entsprecbende Restriktionsen- 
zyme erhalten. Die Verwendung der SpleiEvarianten hangt von 
der individuellen Situation der Probanden ab. 




tikorper 



Dariiber hinaus werden monoklonale Antikorper fur Bereiche des 
YYl-Proteins erzeugt und zur Abregulation verwendet. Auch 
hierbei sind die Antikorper der ' individuelle Situation anzu- 
passen. 



2.3 Erhohung der YY1- Express ion 

Die gesamte DNA-Sequenz oder Teilsequenzen von YY1 (Positionen 
73 bis 564, 565 bis 717, 718 bis 834, 835 bis 1071; 955 bis 
999, 955 bis 1041, 1000 bis 1041, 1042-1125, 1759 bis 1848, 
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1849 bis 1938, 967 bis 1125, 1071 bis 193 8 sowie die Intronse- 
quenz 1126-1758), die sich nach der individuellen Situation 
der Probanden richtet, werden in Plasmiden unter Kontrolle eu- 
karyotischer, gewebsspezif ischer Promotoren kloniert • und zur 
Langz'eitexpression von YY1 an sich oder seiner Teilsequenzen 
appliziert, um eine gewebsspezif ische Erhohung der Expression 
von YY1 oder seiner Teilsequenzen zu erreichen. Die Vektorsy- 
steme werden entsprechend dem Stand der Technik eingesetzt 
(Chen, Y. A novel single-stranded DNA expression vector. Ex- 
pert Opin. Biol. Ther. 2, 2002, 735-740) 



^^^^^ 



4. Regulation anderer Gene durch YYl-Antisense 



gesicht der Multifunktionalitat von YY1 wurde Antisense-DNA 
von YY1 mit den in der Genbank vorhandenen Sequenzen auf Uber- 
seinstimmung mit anderen Genen gepruft (siehe Figur 13; die 
angegebenen- Positionen (Numerierungen) beziehen sich auf den 
kodierenden Bereich und nicht auf die Nukleotidnumerierung des 
Sequenzprotokolls) . Diese entsprechenden Sequenzen sollen un- 
ter Nutzung von Kern- Lokali sat ions signalen (NIiS) mit Domanen 
von YY1 gezielt zur Beeinf lussung dieser Gene (funktionelle 
Domane) eingesetzt werden (vgl. Fig. 8) . 



ie Aktivierungsdomanen, Repress ionsdomanen und Zinkfinger von 
1 sollen allein und in alien Kombinationsmoglichkeiten mit- 
einander, mit der Antisense-DNA kreiert werden. Die Kombinati- 
on ist abhangig vom Krankheitsbild, den betroffenen Organen 
und vom Geschlecht. 

Vitamin D, Calciimstof fwechsel \ind Entwicklungsprozesse 

Vitamin D gehort neben dem Parathormon (PTH) , Calcitonin (CT) 
und dem PTH related Peptide (PTHrP) zu den Hauptregulatoren 
des Calciumstof fwechsels. Seit 1966 ist bekannt, daS Vitamin-D 
in einer aktiven Form vorliegen muS, um seine funktionelle 
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Aufgaben wahrnehmen zu konnen (143) . Die aktive Form entsteht 
durch die Hydroxyliemng am C25 sowie am CI Atom. Bezeichnet 
wird diese Form als 1, 25-Dihydroxycholecalif erol * oder als Vit- 
amin-Da . Eine Auf gabe des Calciferols besteht darin, der Absen- 
kung des Plasmacalciumspiegels entgegen zu wirken. Erreicht 
wird dies uber eine vermehrte intestinale Calciumresorption, 
durch gesteigerte renale Calciumresorption und durch gestei- 
gerte Calciummobilistion aus dem Skelettsystems (144) . Die in- 
testinale Resorption benotigt ein "aktives Transportsystem 
(Calcium bindende Proteine, Calbindin) , das nur in Anwe senile it 
von Vitamin-D 3 zu finden ist. Daruber hinaus ist Vitamin-D 3 
jich fur die Erhaltung der Funktionsf ahigkeit der intestinalen 
osazellen verantwortlich. Calbindine, Osteocalcin, Matrix- 
a-Protein, . Osteopontin, Kollagen Typ I etc. werden durch 
Calciferol induziert. EinfluS auf die Proliferation, Diffe- 
renzierung, Hormonsekretion und Apoptose werden auch durch 
Calciferol ausgexibt. Die Bedeutung des Vitamin-D 3 wird an Man- 
ge lerscheinungen, sogenannten Hypovitaminosen (Rachitis, 
Osteomalazie) deutlich (144) . 



%^p y t 



Mit der Entdeckung des Vitamin-D-Rezeptors (VDR; 145, 146) 
konnte der Wirkmechanismus untersucht werden. Mit Hilfe des 
R konnte gezeigt werden, daS Vitamin-D im Kern von Keratino- 
en der Haut, Langerhansschen Inseln des Pankreas, Lympho- 
yten, Promyelozyten etc. lokalisiert ist. Die aktive Form des 
Vitamin-D ist lipophil, so daS es uber Diffusion durch die 
Zellmembran in die Zelle und weiter in den Zellkern gelangt 
und dort mit hoher Affinitat an seinen Rezeptor bindet. Der 
VDR gehort zu der Familie der ligandengesteuerten Transkripti- 
onsfaktoren. Nach Aktivierung durch seinen Liganden, moduliert 
VDR die Transkription solcher Genabschnitte, die ein dem Re- 
zeptor zugeordnetes DNA-Element tragen, die sogenannten Hormo- 
ne -Response-Elemente (HRE) . Fiir den VDR werden diese Genab- 
schnitte Vitamin-D-Response Elemente (VDREs) genannt. Gene, 
die VDRE enthalten, sind u.a. Osteocalcin (OC) , Calbindin D9k 
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(CALB3) land D28k (CALB1) , Vitamin-D 24 -Hydroxylase (CYP24) , 
Osteopontin (OPN) , atriale natriuretische Peptid (ANP) , Para- 
thormon (PTH) , Carbonaiihydrase II (CA-II) , Integrin, beta-3 
(ITGB3), Fibronektin (FN1) , c-fos, Parathormon- related Peptid 
(PTHrP) , „slow myosin heavy chain 3 U (slowMyHC3) , gewebespezi- . 
fischer Plasminogenaktivator (t-PA) , Wachs turns fakt or 1 (PIT1; 
POU1F) und Involucrin (IVL) . 

Die Studie von DeLuca et al. (147) zeigte, daJS sich die aktive 
Form des Vitamins auch in Lymphozyten (CD4 und CD8) , insbeson- 
dere in aktivierten T-Lypmphozyten befindet. Immunsupression 
iron Autoimmunkrankheiten konnte auf die aktive Form von Vit- 
in-D 3 und Ca 2+ zuruckgefutirt werden. Da im Rahmen der vorlie- 
enden Erfindung gezeigt werden konnte, daS bei Ca 2+ -reicher 
Diat die Diabetes ins idenz von BB.6S-Ratten von 15 auf 45% er- 
hoht werden kann, muS bier ein weiterer Regelmecbanismus von 
YY1 existieren. 

Guo et al. (148) konnte erstmals die Rolle von YY1 im Calcium- 
stof fwechsel fur das Osteocalcingen zeigen. YY1 reprimiert die 
1, 25-Dihydroxcholecalcif erol vermittelte Transaktivierung des 
knochenspezif ischen Osteocalcingens . Aufgrund der Interaction 
von YY1 mit beiden Komponenten, VDR und Transkritionsf aktor 
IB (TFIIB) v ist er in der Lage, die von Vitamin-D abhangigen 
ranskriptionen zu regulieren. Daruber binaus konkurriert das 
VDR/RXR (Retinoid X Receptor) -Heterodimer mit YY1 urn die Bin- 
dungsstellen der VDR-Elemente im Osteocalcingen. Da VDREs in 
vielen Genen vorhanden sind, iibemimmt YY1 dort weitere regu- 
latorische Rollen. 

Zusatzlich. ist es YY1 moglich, bereits in die Synthese von 
Calciferol einzugreif en. Durch die Repression der Transkripti- 
on des Enzyms, 25 -Hydroxyvitamin-D3 -24 -hydroxylase [24(OH)ase; 
CYP24], ist der Katabolismus gestort. Eine erhohte Repression 
konnte in Anwesenheit von TFIIB oder CBP (CREB- Binding- 
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Protein) festgestellt werden (149) . Daruber hinaus konnte bei 
transgenen Ratten, bei denen CYP24 iiberexprimiert wurde, ge- 
zeigt werden, daS diese Tiere eine Albuminurie und Hyperlipi- 
damie entwickelten. Eine Beobachtung, die in diesem Zusammen- 
hang an die erhohten Blutfette der BB.6S-Ratten im Vergleich 
zum Parental staram, der BB/OK-Ratte, erinnert. Auch entwickel- 
ten diese transgenen Ratten atherosklerotische Lasionen an der 
Aorta (150) . 

Dafi der VDR im Zusammenhang mit dem Typl-Diabetes steht, konn- 
te von der Gruppe Chang et al. (151) gezeigt werden. Als di- 
,ekter negativer Faktor fungiert die aktive Form von Vitamin-D 
h im Renin-Angiotens in- System. Dieses System spielt eine 
Tchtige Rolle in der Regulation des Flussigkeits- und Elek- 
trolythaushalts und somit auch in der Blutdruckkontrolle. Bei 
Abweichung des Vitamin-D-Levels kommt es zur direkten Inhibie- 
rung der Renin- Gen- Express ion. Somit spielt Vitamin-D nicht 
nur als Regulator bei der Auf rechterhaltung der Calcium- 
Homostase eine Rolle sondern auch im Homostase-Prozess der 
Elektrolyte, dem Blutvo lumen und Blutdruck (152) . Unterstut- 
zend dazu kann die Studie von Bhalla et al . (153) herangezogen 
werden. Man konnte zeigen, dafi YY1 synergist isch mit GATA-4 
Is transkriptioneller Komplex uber CBP/p3 00 die „brain natri- 
etic" Peptid (BNP) -Gen-Transkription aktiviert. BNP gehort 
ur Familie der natriuretischen Peptide, die aus 3 Peptiden 
(atriale natriuretische Peptid, ANP; BNP; natriuretische Pep- 
tid Typ C, CNP) besteht. Ihre Hauptwirkung liegt in einer Zu- 
nahme der Natriumausscheidung, in einer Gef aSerweiterung 
(Vasodilatation) und in einer Abnahme der Aldosteronsekretion 
(wichtigstes Mineralocorticoid, beeinfluSt den Natrium-, Kali- 
urn- und Wasserhaushalt in samtlichen Geweben) , womit sie den 
eigentlichen Gegenspieler des Renin- Angiotensin- Aldosteron- 
Systems darstellen. GATA-4 gehort zu der Familie der GATA- 
Zi-nk-Finger-Transkriptionsfaktoren und ist im adulten Gewebe 
des Herzens, im Darmepithel und Gonaden exprimiert. Wahrend 
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cier Fetalentwicklung ist GATA-4 bei der Herzf ormation betei- 
ligt. Daher fungieren GATA-4 als auch YY1 gleichermaSen als 
Schlusselelement bei der myocardialen Dif f ereiizierung und 
Funktion. Beide beeinf lussen zahlreiche Herz-Gene (154-158) . 
Unter Anderem konnte gezeigt werden; daS YY1 in Verbindung mit 
der Hypertrophy in Herzmyocyten (uber ILip vermittelt) steht 

(159) . 

In Anbetracht der bisher vorliegenden Arbeiten 7 sowie eigener 
Ergebnisse (s.o.), kann der SchluS gezogen werden, daS YY1 in 
den Calciumstof fwechsel selbst eingreift oder aber durch Cal- 
ium (und deren Komponenten) beeinf luSt wird. AuSerdem kann 
on ausgegangen werden, daS YY1 eine wesentlicbe Rolle bei 
.er Blutdruckregulation und Muskelkontraktion zukommt. Daher 
soil je nach betrof f enem Gewebe und in Abhangigkeit vom Ge- 
schlecht YY1 ab- oder aufreguliert werden. 

Mit Hilfe von Maus-Embryonen konnte dargestellt werden, daS 
YY1 in dem Entwicklungsprozess von Knochen eine bedeutende 
Rolle hat. Er ist in der Lage das MSX2 Gen zu aktivieren 

(160) . MSX2 gehort zu der Klasse der Homoobox-Genen und wird 
in zahlreichen Geweben von Embryonen exprimiert. Als Schliis- 

elmediator ist MSX2 wahrend verschiedenster Entwicklungspro- 
esse, wie zum Beispiel bei der Formation von Schadel, Zahnen, 
.ugen, sowie in der cranio -facialen Morphogenese beteiligt. Er 
ist involviert in der epithelialen-mesenchymalen Interaktion 
und Apoptose (161-165) . Bei Dysregulation des Express ions level 
von Mxs2 konnte abnormes Wachstum festgestellt werden. Zwei 
Faktoren, BMP 4 (Bone Morphogenetic Protein Typ 4) und YY1 re- 
gulieren die Expression von MSX2 in embryonal en Geweben (166) . 
Unabhangig von BNP4 ist YY1 im Stande an drei Stellen des Pro- 
motors von MSX2 zu binden und somit zu aktivieren (160) . Die 
Involvation von YY1 in die Prozesse der Embryogenes, Neuronal - 
, Skelettmuskel- und Knochenentwicklung laSt den SchluS zu, 
daS YY1 mit Sicherheit bei Mutation oder Fehlregulation an Er- 
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krankungen der Muskeln, Knochen und dem Gehirn entscheidend 

beteiligt sein wird (167) . Daher kann auch hierbei je nach be- 

troffenem Gewebe und in Abhangigkeit vom Geschlecht, YY1 ab- 
oder aufreguliert werden. 



Eine Beteiligung von YY1 konnte auch bei der zystischen Fibro- 
se (Mukoviszidose) gezeigt werden (168) . Diese Erkraiikung ist 
die haufigste angeborene, autosomal rezessiv vererbte Stoff- 
wechselerkrankung und durch ein hochviskoses eiweilSreiches Se- 
kret der mukdsen Driisen gekennzeichnet . Dieses Sekret ftihrt 
|^ir Verstopfung der Ausfubrungsgange mit zystischer Erweite- 
L MR^ fibrotischer Umwandlung und dam it zu schwerwiegenden 

^rgankomplikationen, vorwiegend . an der Lunge. Verursacht wird 
diese Erkrankung durch eine Mutation im „ cystic fibrosis 
transmembrane conductance regulator* (CFTR) , der als Chlorio- 
dionenkanal funktioniert . Diese Mutation bewirkt, daS der CI" 
Kanal vermindert auf cAMP in der apikalen Membran von Epithel- 
zellen anspricht. Die herabgesetzte Sekretion von CI" und damit 
auch die von Na + , HC03" und Wasser erhoht die Viskositat und 
den Proteingehalt des luminalen Sekrets (169) . 

fntersuchungen des CFTR- Promotors zeigte eine Sequenzvariation 
-102T>A) , die die Transkriptionsaktivitat beeinflufit. Das - 
02A- Allele erhohte signifikant die basale CFTR-Expression. 
Durch DNA-Protein-Interaktion-Assays konnte gezeigt werden, 
daS um die Position -102 mehrere Proteine binden, u.a. auch 
YY1. YY1 aktiviert den CFTR-Promotor und erhoht signifikant 
die CFTR-Expression, was den milderen Verlauf der Erkrankung 
bei CFTR-Mutation erklaren konnte (168) . Demnach kann man 
durch YY1 -Auf regulation das Fort schrei ten der zystischen Fi- 
brose kompensierbar machen. 
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Kongene und transgene Tiere 

Itn Rahmen der vorliegenden Erfindung wurden ferner kongene 
nicht-menschliche Sauger, vorzugsweise Ratten, erzeugt, die 
eine fur (das mutierte) YY1 gemaS SEQ ID NO : 4 kodierende Nu- 
kleinsauresequenz enthalten. Bei dem Sanger handelt es sich 
vorzugsweise urn eine Ratte. Die Sauger sind durch eine ernied- 
rigte Typ-l-Diabetesinzidenz charakterisiert . In gleicher 
Weise ist es moglich, transgene Sauger, vorzugsweise Ratten, 
zu erzeugen, die sich dadurch auszeichnen, dass sie ebenfalls 
eine fur (das mutierte) YY1 kodierende Nukleinsauresequenz 
^s . o • ) enthal ten . 

Wie Erfindung stellt ferner erstmals ein Verfahren zum Identi- 
fieren diabetesprotektiver Wirkstoffe bereit, bei dem den vor- 
genarmten Saugern potentielle Wirksubstanzen verabreicht wer- 
den und man tiberpruft, in wieweit die Neigung, Typ- 1 -Diabetes 
zu entwickeln, reduziert wird. Gegenstand der Erfindung ist 
somit auch die Verwendung eines trans genen oder kongenen 
nicht-mensch.lich.er Saugers ; dessen Keim- und somatische Zellen 
eine Nukleinsaure oder einen Nukleinsaureabschnitt enthal ten, 
-die/der fur ein Protein mit der in SEQ ID NO: 4 (SHR) gezeigten 
/^^^?^^minosauresequenz oder einer dazu homologen Aminosauresequenz 
|> jB s -°-) kodiert, wobei die homologe Amino sauresequenz an Posi- 
^y^;ion 3 03 Methionin und an Position 311 Arginin aufweist, zum 
Identif izieren Diabetes -protektiver Substanzen. 

Die Erfindung betrifft ferner transgene nicht-menschliche Sau- 
ger, insbesondere Ratten, deren Keim- und somatische Zellen ei- 
ne Nukleinsaure oder einen Niikleinsaureabschnitt enthalten, 
die/der fur ein Protein mit der in SEQ ID NO: 2 gezeigten Ami- 
nosauresequenz oder einer dazu homologen Aminosauresequenz 
(s.o.) kodiert, wobei die homologe Aminosauresequenz an Posi- 
tion 3 03 Arginin und an Position 311 Lysin aufweist. 
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Die vorgenannten Sauger exprimieren das Protein vorzugsweise 
im Pankreas . 

Weitere Erf induncrscreaenstande 



Die Erfindung betrifft ferner weitere Gegenstande und Ausfuh- 
rungsf ormen , die sich fur den Fachmann vor dem Hintergrund der 
vorliegenden Offenbarung muhelos erschlieSen. 



In diesem Zus ammenliang sind auch Vorrichtungen (Kits) zur 

Krchfiihrung eines der vorgenannten (Screening-) Verfahren zu 
nnen. 
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SEQUENZPROTOKOLL 



<110> Emst-Moritz-Arndt-Universitat Greifswald 

<12-0> Verwendung des multifunktionellen Transkrip t ions fak tors Yin- Yang- 1 
und Varianten davon zur Behandlung von Erkrankungen, insbesondere von Typ- 
Diabetes 

<130> P 61438 

<160> 8 

<170> Patentln version 3.1 

<210> 1 

<211> 2256 

12> DNA 

3> Rattus norv. 

20> 

<221> CDS 

<222> (73) . . (1125) 

<223> YY1 (BB/OK) 



<220> 

<221> misc_f eature 

<222> (1759) . . (1917) 

<223> Zinkfinger 



<220> 

<221> mis cofeature 

<222> (955) . (1125) 

<223> Zinkfinger 



220> 

221> Intron 
<222> (1126) ... (1758) 
<223> 



<220> 

<221> • promoter 
<222> (1)..(72) 
<223> 



<220> 

<221> CDS 

<222> (1759) . . (1938) 

<223> YY1 (BB/OK) 



<400> 1 

ccgcctcctc gcccgccctc ccgcagccca ggagccgagg ctgccgcggc cgtggcggcg 60 
gagccctcag cc atg gcc teg ggc gac acc etc tac att gec acg gac ggc 111 
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Met Ala Ser Gly Asp Thr Leu Tyr lie Ala Thr Asp Gly 
15 10 

teg gag atg cca gec gag ate gtg gaa ctg cat gag att gag gtg gag 
Ser Glu Met Pro Ala Glu He Val Glu Leu His Glu He Glu Val Glu 
15 20 25 

acc ate ccg gtg gag act ate gag ace acg gtg gtg ggc gag gag gag 
Thr He Pro Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu 
30 35 40 45 

gac gac gac gaa gac gac gag gat ggt ggc ggc gga gac cac ggt ggc 
Asp Asp Asp Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly 
50 55 60 

ggg ggc ggc cac ggg cac get ggc cac cac cat cac cac cac cac cac 
Gly Gly Gly His Gly His Ala Gly His His His His His His His His 
65 70 75 

cac cac ccg ccc atg ate gcg ctg cag ccg ctg gtc acc gac gac ccg 
"is His Pro Pro Met He Ala Leu Gin Pro Leu Val Thr Asp Asp Pro 
'80 85 90 

c caa gtg cac cac cac caa gag gtg att ctg gtg cag acg cgc gag 
Thr Gin Val His His His Gin Glu Val He Leu Val Gin Thr Arg Glu 
95 100 105 

gag gta gtg ggt ggc gac gac teg gac ggg ctg cgc gec gag gac ggg 
Glu Val Val Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly 
HO 115 120 " 125 

ttc gag gac cag ate etc att ccg gta ccc gcg ccg gee ggc gga gac 
Phe Glu Asp Gin He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp 
130 135 140 

gac gac tac ate gag cag acg ctg gtc acc gtg gcg gcg gec ggc aag 
Asp Asp Tyr He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys 
145 150 155 

age ggt ggc ggg tct teg teg ggc ggc ggc cgc gtt aag aag ggc ggc 
Ser Gly Gly Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly 
160 165 ^ 170 

ggc aag aag age ggc aag aag agt tac ctg ggc age ggg gec ggc gcg 
Gly Lys Lys Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala 
175 180 185 

gcg ggc ggt ggc ggc gee gac ccg ggt aat aag aag tgg gaa cag aag 
Ala Gly Gly Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys 
190 195 200 205 

cag gtg cag ate aag acc ctg gag ggc gag ttc teg gtc acc atg tgg 
Gin Val Gin He Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp 
210 215 220 

tct tea gat gaa aaa aaa gat att gac cat gaa aca gtg gtt gaa gag 
Ser Ser Asp Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu 
225 230 235 

cag ate att ggg gag aac tea cct cct gat tat tct gaa tat atg aca 
Gin He He Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr 
240 245 " ~ 250 
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ggc aag aaa etc cct cct gga ggg at a cct ggc att gac etc tea gac ' 879 
Gly Lys Lys Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp 
255 260 265 

ccc aag caa ctg gca gaa ttt gee aga atg aag cca aga aaa att aaa 927 
Pro Lys Gin Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys 
270 275 280 ~ 285 

gaa gat gat get cca aga aca ata get tgc cct cat aaa ggc tgc aca 975 
Glu Asp Asp Ala Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr 
290 295 ~ 300 

aag atg ttc agg gat aac tct get atg aga aag cat ctg cac ace cac 1023 
Lys Met Phe Arg Asp Asn Ser Ala Met Arg Lys His Leu His Thr His 
305 310 " 315 

ggt ccc aga gtc cac gtc tgt gca gaa tgt ggc aaa gcg ttc gtt gag 1071 
Gly Pro Arg Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu 
320 325 330 



mgc tea aag eta aaa cga cac cag ctg gtt cat 
mtr Ser Lys Leu Lys Arg His Gin Leu Val His 

W 335 ' 340 


act gga gaa aag ccc 
Thr Gly Glu Lys Pro 
345 


in o 


ttt cag gtagagccag ttcctgttcc ccaaactgca agctagggtg ctggtcaggg 

Phe Gin 

350 


1175 


tggttgatat 


caagcactat 


ggggcacegg 


ttggggtatt 


ttattcccat 


ccctcctgtc 


1235 


tgcttgggtt 


cctggttact 


getegggact 


gcaggtgtta 


cagatggggg 


tggagggatt 


1295 


atgegaagea 


cccccacact 


aaatttctag 


caggtttaca 


aaaactcaac 


agttttgttt 


1355 


tgtagtgagt 


agtgtgttga 


attactgata 


gagtgettat 


aagtgctgtt 


ggctacagct 


1415 


ccaggtgaca 


cttggtgctg 


cttatagaag 


actcgtgagt 


tgacagttgg 


catcactaaa 


1475 


tatcttaatc 


atctgtagtc 


tacttcctag 


agtgtctctg 


aaaacactca 


agctgtaaat 


1535 


ttgcactcag 


cacagccctt 


ctgtttctca 


agaactagee 


atgggttgtt 


agtatcagag 


1595 


atcccagtgt 


gtcagttcta 


aaataccctc 


agaagggttc 


cagacgagga 


aggaggcatg 


1655 


ctcagcagaa 


tagtaggtgg 


tttccatcta 


agcagtgagc 


catcgatccc 


caggttctgg 


1715 


tetcatttge 


caagagggtt 


gatatctggt 


ttttccttga 


cag tgc aca ttc gaa 
Cys Thr Phe Glu 


1770 



355 

ggc tgc ggg aag cgc ttt tea ctg gac ttc aat ttg cgc acg cat gtg 1818 
Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg Thr His Val 
"360 365 370 

cga ate cat acc gga gac agg ccc tat gtg tgc ccc ttc gac ggt tgt 186 6 

Arg He His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe Asp Gly Cys 
375 380 385 

aat aag aag ttt get cag tea act aac ctg aaa tct cac ate tta aca 1914 
Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu .Lys Ser His He Leu Thr 
390 395 400 
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cac get aaa gec aaa aac aac cag tgaaaagaag agagaagacc ttctcgaccc 1968 
His Ala Lys Ala Lys Asn Asn Gin 
405 410 

egggaagect cttcaggagt gtgattggga ataaatatgc ctctcctttg tatattattt 2028 

ctaggaagaa ttttaaaaat gaatcctaca cacttaaggg acatgttttg ataaagtagt 2088 

aaaaatttaa aaaaatactt taataagatg acattgetaa gatgetctat ettgetctgt 2148 

aatctcgttt caaaaacaag gtgtttttgt aaagtgtggc cccaacagga ggacaattca 22 08 

tgaacttege atcaaaagac aattctttat acaacagtgc taaaaatg 2256 

<210> 2 

<211> 411 

<212> PRT 

<213> Rattus norv. 



220> 

1 > mi s c_f e ature 

2> (1759) (1917) 

23> Zinkfinger 



<220> 

<221> misc_f eature 

<222> (955) . . (1125) 

<223> Zinkfinger 

<;400> 2 

Met Ala Ser Gly Asp Thr Leu Tyr He Ala Thr Asp Gly Ser Glu Met 
1 5 10 15 

Pro Ala Glu He Val Glu Leu His Glu He Glu Val Glu Thr He Pro 
20 25 . 30 

Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu Asp Asp Asp 
35 4 0 45 



Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly 
50 55 60 

His Gly His Ala Gly His His His His His His His His His His Pro 
65 70 75 80 

Pro Met He Ala Leu Gin Pro Leu Val Thr Asp Asp Pro- Thr Gin Val 
85 90 ** 95 

His His His Gin Glu Val He Leu Val Gin Thr Arg Glu Glu Val Val 
100 105 " 110 



Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly Phe Glu Asp 
115 120 125 
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Gin lie Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp Asp Asp Tyr 
130 135 140 



He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys Ser Glv Glv 
145 150 155 " 



160 



Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly Gly Lys Lys 

165 170 " 175 

Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala Ala Gly Gly 

180 185 " 190 




Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys Gin Val Gin 
195 200 205 



Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp Ser Ser Asp 
210 215 220 



Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu Gin He He 
225 230 235 240 

Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr Gly Lys Lys 
245 250 255 

Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp Pro Lys Gin 
260 265 270 

Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys Glu Asp Asp 
275 280 285 



a Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr Lys Met Phe 
290 295 300 



Arg Asp Asn Ser Ala Met Arg Lys His Leu His Thr His Gly Pro Arg 
3 °5 310 315 ~ 320 

Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu Ser Ser Lys 
325 330 335 

Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro Phe Gin Cys 
340 345 350 



Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg 
355 360 365 



Thr His Val Arg He His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe 
370 375 380 
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Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys Ser His 
385 390 395 400 

lie Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 



<210> 3 

<211> 2256 

<212> DNA 

<213> Rattus norv. 

<220> 

<221> CDS 

<222> (73) . . (1125) 

<223> YY1 (SHR) 

20> 

1> misc_f eature 

22> (1759) . . (1917) 

<223> Zinkfinger 



<220> 

<221> mi sc_f eature 

<222> (955) . . (1125) 

< 2 2 3 > Zinkf inger 



<220> 

<2 21> Intron 

<222> (1126) . . (1758) 

<223> 



<220> 

<221> promoter 

222> (1)..(72) 
223> 



<220> 

<221> CDS 

<222> (1759) . . (1938) 

<223> YY1 (SHR) 



<400> 3 

ccgcctcctc gcccgccctc ccgcagccca ggagccgagg ctgccgCggc cgtggcggcg 60 

gagccctcag cc atg gcc teg ggc gac acc etc tac att gcc acg gac ggc 111 
Met Ala Ser Gly Asp Thr Leu Tyr He Ala Thr Asp Gly 
1 5 10 

teg gag atg cca gcc gag ate gtg gaa ctg cat gag att gag gtg gag 159 
Ser Glu Met Pro Ala Glu He Val Glu Leu His Glu He Glu Val Glu 
15 20 25 
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W 



acc ate ccg gtg gag act ate gag acc acg gtg gtg ggc gag gag gag 
Thr He Pro Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu 
30 35 40 45 

gac gac gac gaa gac gac gag gat ggt ggc ggc gga gac cac ggt ggc 
Asp Asp Asp Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly 
50 55 " 60 

ggg ggc ggc cac ggg cac get ggc cac cac cat cac cac cac cac cac 
Gly Gly Gly His Gly His Ala Gly His His His His His His His His 
65 70 75 

cac cac ccg ccc atg ate gcg ctg cag ccg ctg gtc acc gac gac ccg 
His His Pro Pro Met He Ala Leu Gin Pro Leu Val Thr Asp Asp Pro 
80 85 90 

acc caa gtg cac cac cac caa gag gtg att ctg gtg cag acg cgc gag 
Thr Gin Val His His His Gin Glu Val He Leu Val Gin Thr Arg Glu 
95 100 105 

ag gta gtg ggt ggc gac gac teg gac ggg ctg cgc gee gag gac ggg 
Val Val Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly 
115 120 125 



tc gag gac cag ate etc att ccg gta ccc gcg ccg gee ggc gga gac 
Phe Glu Asp Gin He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp 
130 135 140 

gac gac tac ate gag cag acg ctg gtc acc gtg gcg gcg gee ggc aag 
Asp Asp Tyr He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys 
145 150 155 

age ggt ggc ggg tct teg teg ggc ggc ggc cgc gtt aag aag ggc ggc 
Ser Gly Gly Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly 
160 165 170 

ggc aag aag agt ggc aag aag agt tac ctg ggc age ggg gee ggc gcg 
Gly Lys Lys Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala 
!75 180 .185 



gc 
9 



gcg ggc ggt ggc ggc gee gac ccg ggt aat aag aag tgg gaa cag aag 
a Gly Gly Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys 
90 195 200 205 



cag gtg cag ate aag acc ctg gag ggc gag ttc teg gtc acc atg tgg 
Gin Val Gin He Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp 
210 215 220 

tct tea gat gaa aaa aaa gat att gac cat gaa aca gtg gtt gaa gag 
Ser Ser Asp Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu 
225 230 235 

cag ate att ggg gag aac tea cct cct gat tat tct gaa tat atg aca 
Gin He He Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr 
240 245 250 

ggc aag aaa etc cct cct gga ggg ata cct ggc att gac etc tea gac 
Gly Lys Lys Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp 
255 260 265 

ccc aag caa ctg gca gaa ttt gee aga atg aag cca aga aaa att aaa 
Pro Lys Gin Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys 
270 275 280 ~ 285 
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gaa gat gat get cca aga aca ata get tgc cct cat aaa ggc tgc aca 
Glu Asp Asp Ala Pro Arg Thr lie Ala Cys Pro His Lys Gly Cys Thr 
2^0 295 300 

aag agg ttc agg gat aac tct get atg aaa aag cat ctg cac acc cac 
Lys Arg Phe Arg Asp Asn Ser Ala Met Lys Lys His Leu His Thr His 
305 310 315 

ggt ccc aga gtc cac gtc tgt gca gaa tgt ggc aaa gcg ttc gtt gag 
Gly Pro Arg Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu 
320 325 330 

age tea aag eta aaa cga cac cag ctg gtt cat act gga gaa aag ccc 
Ser Ser Lys Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro 
335 340 345 

ttt cag gtagagccag ttcctgttcc ccaaactgca agctagggtg ctggtcaggg 
Phe Gin 
350 




tgatat caagcactat ggggcacegg ttggggtatt ttattcccat ccctcctgtc 

cttgggtt cctggttact getegggact gcaggtgtta cagatggggg tggagggatt 

atgegaagea cccccacact aaatttctag caggtttaca aaaactcaac agttttgttt 

tgtagtgagt agtgtgttga attactgata gagtgettat aagtgctgtt ggctacagct 

ccaggtgaca cttggtgctg cttatagaag acacgtgagt tgacagttgg catcactaaa 

tatcttaatc atctgtagtc tacttcctag agtgtctctg aaaacactca agctgtaaat 

ttgcactcag cacagccctt ctgtttctca agaactagee atgggttgtt agtatcagag 

atcccagtgt gtcagttcta aaataccctc acaagggttc cagacgagga aggaggectg 

ctcagcagaa tagtaggtgg tttccatcta agcagtgagc catcgatccc caggttctgg 

tetcatttge caagagggtt gatatctggt ttttccttga cag tgc aca ttc gaa 

Cys Thr Phe Glu 

• ' 355 

ggc tgc ggg aag cgc ttt tea ctg gac ttc aat ttg cgc acg cat gtg 
Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg Thr His Val 
360 365 370 

cga ate cat acc gga gac agg ccc tat gtg tgc ccc ttc gac ggt tgt 
Arg lie His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe Asp Gly Cys 
375 380 385 

aat aag aag ttt get cag tea act aac ctg aaa tct cac ate tta aca 
Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys Ser His lie Leu Thr 
390 395 400 

cac get aaa gee aaa aac aac cag tgaaaagaag agagaagacc ttctcgaccc 
His Ala Lys Ala Lys Asn Asn Gin 
405 410 

egggaagect cttcaggagt gtgattggga ataaatatgc ctctcctttg tatattattt 

ctaggaagaa ttttaaaaat gaatcctaca cacttaaggg acatgttttg ataaagtagt 



975 

1023 

1071 

1119 

1175 

1235 
1295 
1355 
1415 
1475 
1535 
1595 

* 

1655 
1715 
1770 

1818 

1866 

1914 

1968 

2028 
2088 
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aaaaatttaa aaaaatactt taataagatg acattgctaa gatgctctat cttgctctgt 2148 
aatctcgttt caaaaacaag gtgtttttgt aaagtgtggt cccaacagga ggacaattca 2208 
tgaacttcgc atcaaaagac aattctttat acaacagtgc taaaaatg 2256 




<210> 


4 


<211> 


411 


<212> 


PRT 


<213> 


Rattus norv. 


<220> 




<221> 


mi sc__f eature 


<222> 


(1759) . . (1917) 


<223> 


Zinkf inger 


<220> 




<221> 


mi s c_f eatur e 


<222> 


(955) . . (1125) 


<223> 


Zinkf inger 


ltoo> 


4 



t Ala Ser Gly Asp Thr Leu Tyr He Ala Thr Asp Gly Ser Gin Met 
1 5 io - 15 



Pro Ala Glu He Val Glu tieu His Glu lie Glu Val Gin Thr He Pro 
20 25 30 

Val Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu Asp Asp Asp 
35 40 45 



Glu Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly 
50 55 60 



His Gly His. Ala Gly His His His His His His His His His His Pro 
65 70 75 80 



Pro Met He Ala Leu Gin Pro Leu Val Thr Asp Asp Pro Thr Gin Val 
85 90 ~ 95 



His His His Gin Glu Val He Leu Val Gin Thr Arg Glu Glu Val Val 
100 105 ~ 110 



Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly Phe Glu Asp 
115 120 125 



Gin He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp Asp Asp Tyr 
130 135 140 



He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys Ser Gly Gly 
145 150 155 160 
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Gly Ser Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly Gly Lys Lys 
165 170 175 

Ser Gly Lys Lys Ser Tyr Leu Gly Ser Gly Ala Gly Ala Ala Gly Gly 
180 185 ^ 190 



Gly Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys Gin Val Gin 
1^5 200 205 



lie Lys Thr Leu Glu Gly Glu Phe Ser Val Thr Met Trp Ser Ser Asp 
210 215 220 



Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu Gin He He 
225 230 235 240 



ly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr Gly Lys Lys 
245 250 255 



Leu Pro Pro Gly Gly He Pro Gly lie Asp Leu Ser Asp Pro Lys Gin 
260 265 270 



Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys Glu Asp Asp 
275 280 285 



Ala Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr Lys Arg Phe 
290 295 300 



Arg Asp Asn Ser Ala Met Lys Lys His Leu His Thr His Gly Pro Arg 
305 310 315 ' * 320 



Val His Val Cys Ala Glu' Cys Gly Lys Ala Phe Val Glu Ser Ser Lys 
325 330 335 



Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro Phe Gin Cys 
340 345 " 350 



Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg 
355 360 ^ 365 ' 



Thr His Val Arg He His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe 
370 375 380 



Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys Ser His 
385 • 390 395 400 



He Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 
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<210> 5 

<211> 1600 

<212> * DNA 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (43).. (1284) 

<223> YY1 (Human) 

<400> 5 

gaattcggca cgagggcggc cgtggcggcg gagccctcag cc atg gcc teg ggc 54 

Met Ala Ser Gly 
1 

gac acc etc tac ate gcc acg gac ggc teg gag atg ccg gcc gag ate 102 
Asp Thr Leu Tyr lie Ala Thr Asp Gly Ser Glu Met Pro Ala Glu lie 
5 10 15 20 

gag ctg cat gag ate gag gtg gag acc ate ccg gtg gag acc ate 150 
Glu Leu His Glu lie Glu Val Glu Thr He Pro Val Glu Thr He 
25 30 35 

gag acc acg gtg gtg ggc gag gag gag gag gag gac gac gac gac gag 198 
Glu Thr Thr Val Val Gly Glu Glu Glu Glu Glu Asp Asp Asp Asp Glu 
40 45 . 50 

gac ggc ggc ggc ggc gac cac ggc ggc ggc ggg ggc ggc cac ggg cac 246 
Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly Gly His Gly His 
55 60 65 

gcc ggc cac cac cat cac cac cac cac cac cac cac cac cac ccg ccc 294 
Ala Gly His His His His His His His His His His His His Pro Pro 
70 75 80 

atg ate gcg ctg gag ccg ctg gtg acg gac gac ccg acc caa gtg cac 342 
Met He Ala Leu Glu Pro Leu Val Thr Asp Asp Pro Thr Gin Val His 
85 90 95 100 

.cac etc cag gag gtg ate ctg gtg cag'acg cgc gag gag gtc gtc ggg 390 
"is Leu Gin Glu Val He Leu Val Gin Thr Arg Glu Glu Val Val Gly 
105 110 ~ 115 

ggg gac gac teg gac ggg ctg cgc gcc gag gac ggc ttc gag gac gag 438 
Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly Phe Glu Asp Glu 
12 0 125 " 130 

ate etc ate ccg gtg ccc gcg ccg gcc ggc ggc gac gac gac tac ata 4 86 

He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp Asp Asp Tyr He 
135 140 ~ 145 

gag cag acg ctg gtc acc gtg gcg gcg gcc ggc aag age ggc ggc ggg 534 
Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys Ser Gly Gly Gly 
150 155 160 

gcc teg teg ggc ggc ggt cgc gtg aag aag ggc ggc ggc aag aag age 582 
Ala Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly Gly Lys Lys Ser 
165 170 175 " " ~ 180 
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ggc aag aag agt tac ctg ggc ggc ggg gcc ggc gcg gcg ggc ggc ggc 
Gly Lys Lys Ser Tyr Leu Gly Gly Gly Ala Gly Ala Ala Gly Gly Gly 
185 190 195 



630 



ggc gcc gac ccg ggg aat aag aag tgg gag cag aag cag gtg cag ate 
Gly Ala Asp Pro Gly Asn Lys Lys Trp Glu Gin Lys Gin Val Gin lie 
200 205 210 

aag acc ctg gag ggc gag tec teg gtc acc atg tgg tec teg gat gaa 
Lys Thr Leu Glu Gly Glu Ser Ser Val Thr Met Trp Ser Ser Asp Glu 
215 220 225 



678 



726 



aaa aaa gat att gac cat gaa aca gtg gtt gaa gag cag ate att gga 
Lys Lys Asp lie Asp His Glu Thr Val Val Glu Glu Gin He lie Gly 
230 235 240 



774 




gag aac tea cct cct gat tat tct gaa tat atg aca ggc aag aaa etc 822 
Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr Gly Lys Lys Leu 
245 250 255 " " 260 

t cct gga ggg ata cct ggc att gac etc tea gac cct aag caa ctg 870 
Pro Gly Gly He Pro Gly lie Asp Leu Ser Asp Pro Lys Gin Leu 
265 270 275 

gca gaa ttt gcc aga atg aag cca aga aaa att aaa gaa gat gat get 918 
Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys Glu Asp Asp Ala 
280 285 * 290 



cca aga aca ata get tgc cct cat aaa ggc tgc aca aag atg ttc agg 
Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr Lys Met Phe Arg 
295 300 305 
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gat aac tct get atg aga aag cat ctg cac acc cac ggt ccc aga gtc 
Asp Asn Ser Ala Met Arg Lys His Leu His Thr His Gly Pro Arg Val 
310 315 320 



1014 



cac gtc tgt gca gag tgt ggc aaa gcg ttc gtt gag age tea aag eta 
His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu Ser Ser Lys Leu 
325 330 335 340 



m 



aaa cga cac cag ctg gtt cat act gga gaa aag ccc ttt cag tgc aca 
.ys Arg His Gin Leu Val His Thr Gly Glu Lys Pro Phe Gin Cys Thr 
345 350 355 



ttc gaa ggc tgc ggg aag cgc ttt tea ctg gac ttc aat ttg cgc aca 
Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn Leu Arg Thr 
360 365 370 



1062 



1110 



1158 



cat gtg gga ate cat acc gga gac agg ccc tat gtg tgc ccc ttc gac 
His Val Gly He His Thr Gly Asp Arg Pro Tyr Val Cys Pro Phe Asp 
375 380 385 



1206 



ggt tgt aat aag aag ttt get cag tea act aac ctg aaa tct cac ate 1254 
Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu Lys Ser His He 
390 395 400 

N 

tta aca cac get aaa gcc aaa aac aac cag tgaaaagaag agagaagacc 13 04 

Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 



ttctcgaccc gggaagcetc ttcaggagtg agattgggaa taaatatgee tctcctttgt 1364 
atattatttc taggaagaat tttaaaaatg aatcctacac acttaaggga catgttttga 1424 
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taaagtagta aaaatttaaa aaatacttta ataagatgac attgctaaga tgctatatct 1484 
tgctctgtaa tctcgtttca aaaacaaggt gtttttgtaa agtgtggtcc caacaggagg 1544 
acaattcatg aacttcgcat caaaagacaa ttctttatac aacagtgcta aaaatg 1600 

<210> 6 

<211> 414 

<212> PRT 

<213> Homo sapiens 

<400> 6 

Met Ala Ser Gly Asp Thr Leu Tyr lie Ala Tlir Asp Gly Ser Glu Met 
1 5 10 * 15 

fro Ala Glu He Val Glu Leu His Glu He Glu Val Glu Thr He Pro 
20 25 30 

1 Glu Thr He Glu Thr Thr Val Val Gly Glu Glu Glu Glu Glu Asp 
35 40 45 

Asp Asp Asp Glu Asp Gly Gly Gly Gly Asp His Gly Gly Gly Gly Gly 
50 55 60 

Gly His Gly His Ala Gly His His His His His His His His His His 
65 70 75 80 

His His Pro Pro Met He Ala Leu Glu Pro Leu Val Thr Asp Asp Pro 
85 90 95 



Thr Gin Val His His Leu Gin Glu Val He Leu Val Gin Thr Arg Glu 
100 105 110 



lu Val Val Gly Gly Asp Asp Ser Asp Gly Leu Arg Ala Glu Asp Gly 
115 12 0 ~ 125 



Phe Glu Asp Glu He Leu He Pro Val Pro Ala Pro Ala Gly Gly Asp 
130 135 140 



Asp Asp Tyr He Glu Gin Thr Leu Val Thr Val Ala Ala Ala Gly Lys 
145 150 155 ^ 160 



Ser Gly Gly Gly Ala Ser Ser Gly Gly Gly Arg Val Lys Lys Gly Gly 
165 170 175 



Gly Lys Lys Ser Gly Lys Lys Ser Tyr Leu Gly Gly Gly Ala Gly Ala 
180 185 A 190 
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Ala Gly Gly Gly Gly Ala Asp Pro Gly Asxi Lys Lys Trp Glu Gin Lys 
155 200 205 



Gin Val Gin He Lys Thr Leu Glu Gly Glu Ser Ser Val Thr Met Trp 
210 215 220 



Ser Ser Asp Glu Lys Lys Asp He Asp His Glu Thr Val Val Glu Glu 
225 230 235 240 



Gin He He Gly Glu Asn Ser Pro Pro Asp Tyr Ser Glu Tyr Met Thr 
245 250 " 255 



Gly Lys Lys Leu Pro Pro Gly Gly He Pro Gly He Asp Leu Ser Asp 
260 265 270 



o Lys Gin Leu Ala Glu Phe Ala Arg Met Lys Pro Arg Lys He Lys 
275 280 ' 285 



Glu Asp Asp Ala Pro Arg Thr He Ala Cys Pro His Lys Gly Cys Thr 
290 295 300 



Lys Met Phe Arg Asp Asn Ser Ala Met Arg Lys His Leu His Thr His 
305 310 315 320 



Gly Pro Arg Val His Val Cys Ala Glu Cys Gly Lys Ala Phe Val Glu 
325 330 ~ 335 



Ser Ser Lys Leu Lys Arg His Gin Leu Val His Thr Gly Glu Lys Pro 
340 345 350 



Phe Gin Cys Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe 
355 360 " 365 



Asn Leu Arg Thr His Val Gly He His Thr Gly Asp Arg Pro Tyr Val 
370 375 ~ 380 



Cys Pro Phe Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr Asn Leu 
385 390 395 400 



Lys Ser His He Leu Thr His Ala Lys Ala Lys Asn Asn Gin 
405 410 



<210> 7 

<211> 1080 

<212> DNA 

<213> Rattus norv. 



<220> 

<221> CDS 
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<222> (883) . . (894) 

<223> Verkurzter Zinkfinger (BB.6S) 
<220> 

<221> CDS 

<222> (898) . . (1056) 

<223> Verkurzter Zinkfinger (BB. 6S) 
<400> 7 

atggcctcgg gcgacaccct ctacattgcc acggacggct cggagatgcc agccgagatc 60 

gtggaactgc atgagattga ggtggagacc atcccggtgg agactatcga gaccacggtg 120 

gtgggcgagg aggaggacga cgacgaagac gacgaggatg gtggcggcgg agaccacggt 180 

ggcgggggcg gccacgggca cgctggccac caccatcacc accaccacca ccaccacccg 240 

ccatgatcg cgctgcagcc gctggtcacc gacgacccga cccaagtgca ccaccaccaa 300 

•gtgattc tggtgcagac gcgcgaggag gtagtgggtg gcgacgactc ggacgggctg 360 

cgccgagg acgggttcga ggaccagatc ctcattccgg tacccgcgcc ggccggcgga 420 

gacgacgact acatcgagca gacgctggtc accgtggcgg cggccggcaa gagcggtggc 480 

gggtcttcgt cgggcggcgg ccgcgttaag aagggcggcg gcaagaagag cggcaagaag 540 

agttacctgg gcagcggggc cggcgcggcg ggcggtggcg gcgccgaccc gggtaataag 600 

aagtgggaac agaagcaggt gcagatcaag accctggagg gcgagttctc ggtcaccatg 660 

tggtcttcag atgaaaaaaa agatattgac catgaaacag tggttgaaga gcagatcatt 72 0 

ggggagaact cacctcctga ttattctgaa tatatgacag gcaagaaact ccctcctgga 780 

gggatacctg gcattgacct ctcagacccc aagcaactgg cagaatttgc cagaatgaag 840 

ccaagaaaaa ttaaagaaga tgatgctcca agaacaatag ct tgc cct cat aaa 894 

Cys Pro His Lys 
1 

r cag tgc aca ttc gaa ggc tgc ggg aag cgc ttt tea ctg gac ttc aat 942 
Cys Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu Asp Phe Asn 
5 10 15 

ttg cgc acg cat gtg cga ate cat acc gga gac agg ccc tat gtg tgc 990 
Leu Arg Thr His Val Arg lie His Thr Gly Asp Arg Pro Tyr Val Cys 
20 25 30 35 

ccc ttc gac ggt tgt aat aag aag ttt get cag tea act aac ctg aaa 1038 
Pro Phe Asp Gly Cys Asn Lys Lys Phe Ala "Gin Ser Thr Asn Leu Lys 
40 45 50 

tct cac ate tta aca cac getaaageca aaaacaacca gtga 1080 
Ser His lie Leu Thr His 
55 



<210> 8 
<211> 57 
<212> PRT 
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<213> Rattus norv. 
<400> 8 

Cys Pro His Lys Cys Thr Phe Glu Gly Cys Gly Lys Arg Phe Ser Leu 
1 5 io 15 

Asp Phe Asn Leu Arg Thr His Val Arg lie His Thr Gly Asp Arg Pro 
20 25 30 

Tyr Val Cys Pro Phe Asp Gly Cys Asn Lys Lys Phe Ala Gin Ser Thr 
35 40 45 



Asn Leu Lys Ser His He Leu Thr His 
50 55 



97 



Patentanspruche ; 

Protein, dadurch gekennzeichnet, daS es die in SEQ ID NO: 4 
dargestellte Aminosauresequenz aufweist. 

Protein, das ein Homologes des Proteins nach Anspruch 1 
ist und eine zu der in SEQ ID NO: 4 dargestellten Sequenz 
homologen Aminosauresequenz aufweist , dadurch gekennzeich- 
net, dass das Protein an Position 303 Arginin und an Posi- 
tion 311 Lysin aufweist. 

Protein nach. Anspruch 2, das einen Homologiegrad von min- 
destens 95%, vorzugsweise von tnindestens 97% und besonders 
bevorzugt von tnindestens 99% aufweist. 

Peptid, dadurch gekennzeichnet, dass es ein Fragment des 
Proteins nach den Anspruchen 1 bis 3 ist und eine Ami- 
nosauresequenz aufweist, die den die Aminosaurepositionen 
3 03 und 311 in SEQ ID NO: 4 umf assenden Sequenzbereich ent- 
halt. 

Peptid nach Anspruch 5, dadurch gekennzeichnet, dass es 
eine Lange von 53 bis 315 Aminosauren aufweist. 

Nukleinsaure, dadurch gekennzeichnet, dass sie ein fur. ein 
Protein oder ein Peptid nach den Anspruchen 1 bis 5 ko- 
diert . 

Nukleinsaure nach Anspruch 6, dadurch gekennzeichnet, dass 
sie die in SEQ ID NO: 3 dargestellte Nukleinsauresequenz 
aufweist. 
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Nukleinsaure nach Anspruch 6, dadurch gekennzeichnet , dass 
sie eine Nukleinsauresequenz aufweist, die den die Nu- 
kleinsaurepositionen 979-981 und 1003-1005 in SEQ ID NO:3 
umfassenden Sequenzbereich enthalt. 

Antikorper, der gegen ein Protein oder Peptid nach den An- 
spruchen 1 bis 5 gerichtet ist. 

Antikorper nach Anspruch 9, dadurch gekeimzeichnet , dass 
er ein monoklonaler oder polyklonaler Antikorper ist. 

Verfahren zur Bestimmung der Neigung, an Typ-1 -Diabetes zu 
erkranken, dadurch gekennzeichnet, dass man genomische DNA 
aus isolierten mononukleare Blutzellen amplif iziert , se- 
quenziert und man Anderungen oder Abweichungen der Nu- 
kleinsauresequenz, die fur ein Protein mit der in SEQ ID 
NO: 6 dargestellten Aminosaureseguenz kodiert, bestimmt, 
wobei eine Abweichung der Codons fur die Aminosauren an 
Position 3 06 und/oder 314 eine erhohte Neigung, an Typ-1- 
Diabetes zu erkranken, anzeigt. 

Verfahren nach Anspruch 11 , dadurch gekeimzeichnet , dass 
man zur Amplif ikation die Primer K815-F/K817-R; K815- 
F/K875; K821-F/K817-R; K821-F/K870 -R; K874-F/K870-R; 

K823-F/K825-R; K884 -F/K806-R; K801-F/K8 04-R; K814-F/KK832 - 
R; K828-F/K833-R; K831-F/K817-R; K815-F/K870-R; K815- 
F/K818-R; K816-F/K819 -R; K834 -F/K83 6-R, F15/R12; F15/R14; 
F15/R13; F57/R16; F57/R20; F57/R21; F59/RR25; F59/RR3 0; 
F59/R33; F95/RR34; F96/R39; F95/R48; F95/R50; F60/R7; 
F60/R8; F60/R66; F60/R67; F96/R76; F96/R77; F96/R81 
F96/R83; F33/R1; F33/R4; F33/R15; F39/R28; F40/R3; oder 
F41/R5 verwendet . 

Verfahren zur Bestimmung der Neigung, an Typ-1 -Diabetes zu 
erkranken, dadurch gekennzeichnet, dass man RNA aus iso- 
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lierten mononukleare Blutzellen oder Gewebsbiopsien iso- 
liert, amplif iziert und guantif iziert , wobei eine erhoh- 
te/verminderte Expression eine erhohte/verminderte Nei- 
gung, an ' Typ- 1 -Diabetes zu erkranken, anzeigt. 

14. Verwendung eines Proteins oder Peptids nach den Anspruchen 
1 bis 5 zur Herstellung einer pharmazeutischen Zusammen- 
setzung. 

Verwendung einer Nukleinsaure nach den Anspruchen 5 bis 8 
oder eines Antisense-Oligonukleotids zu derselben zur Her- 
stellung einer pharmazeutischen Zusammensetzung. 

Pharmazeutische Zusammensetzung, die eine Nukleinsaure 
nach den Anspriichen 5 bis 8 oder ein Antisense- 
Oligonukleotid zu derselben enthalt. 

17 . Pharmazeutische Zusammensetzung, die ein Protein und/oder 
ein Peptid nach den Anspriichen 1 bis 5 enthalt. 

18. Zusammensetzung nach Anspruch 15 oder 16, dadurch gekenn- 
zeichnet, dass sie ferner pharmazeutisch vertragliche 
Hilfs- und/oder Tragerstoffe enthalt. 

19. Zusammensetzung nach den Anspriichen 16 bis 18, dadurch ge- 
kennzeichnet, dass die Zusammensetzung zur intravenosen 
Applikation formuliert ist. 

20. Transgener nicht-menschlicher Sauger, dadurch gekenn- 
zeichnet, daS dessen Keim- und somatische Zellen eine Nu- 
kleinsaure oder einen Nukleinsaureabschnitt enthalten, 
die/der fur ein Protein mit der in SEQ ID NO: 2 gezeigten 
Aminosauresequenz oder einer dazu homologen Aminosaurese- 
quenz mit einem Homologiegrad von mindestens 95%, vorzugs- 
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weise mindestens 97% und besonders bevorzugt mindestens 
99% kodiert, wobei die homologe Aminosauresequenz an Posi- 
tion 303 Methionin und an Position 311 Arginin aufweist. 

21. Sauger nach Anspruch 2 0 , dadurch gekennzeichnet , dass er 
das Protein im Pankreas exprimiert. 

22. Sauger nach Anspruch 2 0 oder 21 , dadurch gekennzeichnet, 
dass er eine Ratte ist. 

23. Verwendung eines transgenen oder kongenen nicht- 
menschlicher Saugers, dessen Keim- und somatische Zellen 
eine Nukleinsaure oder einen Nukleinsaureabschnitt en thai- 
ten, die/der fur ein Protein mit der in SEQ ID NO: 2 ge- 
zeigten Aminosauresequenz oder einer dazu homologen Ami- 
nosauresequenz mit einem Homologiegrad von mindestens 95%, 
vorzugsweise mindestens 97% und besonders bevorzugt minde- 
stens 99% kodiert, wobei die homologe Aminosauresequenz an 
Position 3 03 Methionin und an Position 311 Arginin auf- 
weist, zum Identif izieren Diabetes -pro tektiver Substanzen. 

24. Kit zur Durchftihrung eines Verfahrens nach den Anspruchen 
11 bis 13. 
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Zusammenf assung 



vit. 

r 

ns] 



Die vorliegende Erfindung betrifft die Beeinf lussung der Akti- 
vitat und/oder der Expression des multifunktionellen Tran- 
iptionsfaktors Yin- Yang- 1 (YY1) *and Varianten davon zur Be- 
dlung verschiedenster Erkrankungen. Die Erfindung betrifft 
hsbesondere eine mutierte Nukleinsauresequenz , die • f tir eine 
Variante des humanen YY1 kodiert und der erf indungsgemafi eine 
diabetesprotektive Wirkung zugeschrieben wird. 
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Schwache Interaktion 



Ficrur 3 




Ficrur 4 




Fiaur 6 




Fiqur 7 




f 

Ficrur 8 
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Ficrur 9 



~CA 

■D 



Sequenz- und Proteinvergleich 

f^ R ^ tte CCGCCTCCTCGC CCGCCCTCCCGCAGCCCAGGAGCCGAGGCTGCCGCGGCCGTGGCGGCG 

uS^^^ e CCGCCTCCTCGCC CGCCCTCCCGCAGCCCAGGAGCCGAGGCTGCCGCGGCCGTGGCGGCG 

HOMO SAPIENS <#^CG^C^^GCGGCCGTGGCGGCG 

GAGCCCTCAGCC ATG GCC TCG GGC GAC ACC CTC TAC ATT GCC ACG GAC GGC TCG GAG ATG 
GAGCCCTCAGCC ATG GCC TCG GGC GAC ACC CTC TAC ATT GCC ACG GAC GGC TCG GAG ATG 
GAGCCCTCAGCC ATG GCC TCG GGC GAC ACC CTC TAC AXg GCC ACG GAC GGC TCG GAG ATG 

MASGDT LYI ATDGSEM 
MASGDT LYI ATDGSEM 
MASGDT LYI ATDGSEM 

CCA GCC GAG ATC GTG GAA CTG CAT GAG ATT GAG GTG GAG ACC ATC CCG GTG GAG ACT ATC 
CA GCC GAG ATC GTG GAA CTG CAT GAG ATT GAG GTG GAG ACC ATC CCG GTG GAG ACT ATC 



GCC GAG ATC GTG GA| CTG CAT GAG AT|c GAG GTG GAG ACC ATC CCG GTG GAG ACjg ATC 



A E I V 
P A E I V 
P A E I V 



E T T V V 
E T T . V V 
E T T V V 



G D H G G 
G D H G G 
G D H G G 



CAC CAC CAC CAC 



H H H H 
H H H H 
H H H H H 



T Q V H H 
T Q V ' H H 
T Q V H H 



E 


L 


-H 


E 


I 


E 


• V 


E 


T 


I 


P 


V 


E 


T 


I 


E 


L 


H 


E 


I 


E 


V 


E 


T 


I 


P 


V 


E 


T 


I 


E 


L 


H 


E 


I 


E 


V 


E 


T 


I 


P 


V 


E 


T 


I 


GGC 


GAG 


GAG 


GAG 


GAC 


GAC 


GAC 


GAA 


GAC 


GAC 


GAG 


GAT 


GGT 


GGC 


GGC 


GGC 


GAG 


GAG 


GAG 


GAC 


GAC 


GAC 


GAA 


GAC 


GAC 


GAG 


GAT 


GGT 


GGC 


GGC 


GGC 


GAG 


GAG 


GAG 


GA i 


GA| 


GAC 


GAg 


GAC 


GAC GAG GAS3 GGu GGC GGC 


G 




E 


E 




r> 


D 


E 


D 


D 


E 


D 


G 


G 


G 


G 


E 


E 


E 


D 


D 


D 


E 


D 


D 


E 


D 


G 


G 


G 


' G 


E 


E 


E 


_i_ 


g 


D 


B 


D 


D 


E 


D 


G 


G 


G 


" GGG 


GGC 


GGC 


CAC 




GGG 


CAC 


GCT 


GGC 


CAC 


CAC 


CAT 


CAC 


CAC 


CAC 


GGG 


GGC 


GGC 


CAC 




GGG 


CAC 


GCT 


GGC 


CAC 


CAC 


CAT 


CAC 


CAC 


CAC 


<*! 


GG I 


GGC 


H C 




GGG 


CAC 


GC I 


GGC 


CAC 


CAC 


CAT 


CAC 


CAC 


CAC 


G 


G 


G 


H 




G 


H 


A 


G 


H 


H 


H 


H 


H 


H 


G 


G 


G 


H 




,G 


H 


A 


G 


H 


H 


H 


H 


H 


H 


G 


G 


G 


G 


H 


G 


H 


A 


G 


H 


H 


H 


H 


H 


H 




CCG 


CCC 


ATG 


ATC 


GCG 


CTG 


CAG 


CCG 


CTG 


GTC 


ACC 


GAC 


GAC 


CCG 




CCG 


CCC 


ATG 


ATC 


GCG 


CTG 


CAG 


CCG 


CTG 


GTC 


ACC 


GAC 


GAC 


CCG 


CAC 


CCG 


CCC 


ATG 


ATC 


GCG 


CTG 


gAG 


CCG 


CTG 


GTg 


ACg 


GAC 


GAC 


CCG 




P 


P 


M 


I 


A 


L 


Q 


P 


L 


V 


T 


D 


D 


P 




P 


P 


M 


I 


A 


L 


Q 


P 


L 


V 


T 


D 


D 


P 


H 


P 


P 


M 


I 


A 


L 


Q 


P 


L 


V 


T 


D 


D 


P 


CAC 


CAA 


GAG 


GTG 


ATT 


CTG 


GTG 


CAG 


ACG 


CGC 


GAG 


GAG 


GTA 


GTG 


GGT 


CAC 


CAA 


GAG 


GTG 


ATT 


CTG 


GTG 


CAG ACG 


CGC 


GAG 


GAG 


GTA 


GTG 


GGT 


CTC 


CAg 


GAG 


GTG 


ATC 


CTG 


GTG 


CAG 


ACG 


CGC 


GAG 


GAG 


G m 


GT|S 


GGg 


H 


Q 


' E 


V 


I 


L 


V 


Q 


T 


R 


E 


E 


V 


V 


G 


H 


Q 


E 


V 


I 


L 


V 


Q 


T 


R 


E 


E 


V 


V 


G 


H 


Q 


E 


V 


I 


L 


V 


Q 


T 


R 


E 


E 


V 


V 


G 



Fiqmr 9-1. Forte efczung 



GGC 


GAC 


GAC 


TCG 


GAC 


GGG 


CTG 


CGC 


GCC 


GAG 


GAC 


GGG 


TTC 


GAG 


GAC 


CAG 


ATC 


CTC 


ATT 


CCG 


GGC 


GAC 




± Co 








CGC 


GCC 


GAG 


GAC 


GGG 


TTC 


GAG 


GAC 


CAG 


ATC 


CTC 


ATT 


CCG 


GG f 


GAC 


GAC 


TCG 


GAC 


GGG 


CTG 


CGC 


GCC 


GAG 


GAC 


GGC 


TTC 


GAG 


GAC 


Sag 


ATC 


CTC 


ATE 


CCG 


G 


D 


D 


S 


D 


G 


L 


R 




A 


E 


D 


G 


F 


E 


D 


Q 


I 


L 


I 


P 


G 




u 


Q 


JJ 






R 




A 


E 


D 


G 


F 


E 


D 


Q 


I 


L 


I 


P 


G 


D 


D 


s 


D 


G 


li 


R 




A 


E 


D 


G 


F 


E 


D 


Q 


I 


L 


I 


p 


GTA 


CCC 


GCG 


CCG 


GCC 


GGC 


GGA 


GAC 


GAC 


GAC 


TAC 


ATC 


GAG 


CAG 


ACG 
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GTG 
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GTT 
GTT 
GTT 


GAA 
GAA 
GAA 


GAG 
GAG 
GAG 


CAG 
CAG 
CAG 


ATC 
ATC 
ATC 


ATT 
ATT 
ATT 


GGG 
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GGa 
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-T 



GGC 


AAG 


AAA 


CTC 


CCT 


CCT 


GGA 


GGG 


ATA- 


CCT 


GGC 


ATT 


GAC 


CTC 


TCA 


GAC 


CCC 


AAG 


CAA 


CTG 


GGC 


AAG 


AAA 


CTC 


CCT 


CCT 


GGA 


GGG 


ATA 


CCT 


GGC 


ATT 


GAP 

UAL. 








err* 




r*7V7i 


prprj 

Liu 


GGC 


AAG 


AAA 
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TGC CCT CAT AAA GGC TGC ACA AAG B|| TTC AGG GAT AAC TCT GCT ATG AAG CAT 



TGC ACA AAG fgp 
CAT AAA GGC TGC ACA AAG ^~ 



A 
A 
A 



TGC CCT CAT AAA GGC 
TGC CCT 

* Zinkfinger 

C P H K 

C P H K 

C P H K 



TTC AGG GAT AAC TCT GCT ATG 
TTC AGG GAT AAC TCT GCT ATG 
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CAGTTCCTGTTCCCCAAACTGGAAGCTAGGGTGCTGGTC^ 
C^GTTCCTGTTCCCCAAACTGCAAGCTAGGGTGCTGGTCAGGGT^ 



TGGGGTATTTTATTCCCATCCCTCCTGTCTGCTTGGKSra 

TGGGGTATTTTATTCCCATCCCTCCTGTCTGCTTGGGTTCCTGGTTACTGCTCGGGACTGCAGGTGTTACAGAT 



GGGGGTGGAGGGATTATGCGAAGCACCCCCACACTAAATTTCTAGC 

GGGGGTGGAGGGATTATGCGAAGCACCCCCACACTAAATTTCTAGC^GGTTTACAAAAACT 



TGTAGTGAGTAGTGTGTTGAATTACTCATAGAGTGCTTATA^ 

TGTAGTGAGTAGTGTGTTGAATTACTGATAG AGTGCTTATAAG TGCTGTTGGCTACAGCT CCAGGTGACACTTG 



Ficmr 9-3, Fortsetzuna 



GTGCTGCTTATAGAAGA^CGTGAGTTGAGAGTTGGCATC^CTAAATATCT 
GTGCTGCTTATAGAAGACgCGTGAGTTGACAGTTGGC^ 



AGAGTGTCTCTGAAAACACTCAAGCTGTAAATTTGCACTCAGCACAGCCCTTCTGTT^ 
AGAGTGTCTCTGAAAACACTCAAGCTGTAAATTTGGACTCAGCAC^GCCCTTCT^ 



GGGTTGTTAGTATCAGAGATCCCAGTGTGTCAGTTCTAAAATACCCTCAgAAGGG 

gggttgttagtatcagagatcccagtgtgtcagttctaaaataccctcaBaagggttccagacgagg 



^TGCTCAGCAGAATAGTAGGTGGTTTCC^ 
'^TGCTCAGC^GAATAGTAGGTGGTT^ 
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TCA ACT AAC CTG AAA TCT CAC ATC TTA ACA CAC GCT AAA GCC AAA AAC AAC CAG TGA 

TCA ACT AAC CTG AAA TCT CAC ATC TTA ACA CAC GCT AAA GCC AAA AAC AAC CAG TGA 

TCA ACT AAC CTG AAA TCT CAC ATC TTA ACA CAC GCT AAA GCC AAA AAC AAC CAG TGA 

Zinkfinger * 
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AAAGAAGAGAGAAGACCTTCTCGACCCCGGGAAGCCTCTTCAGGAGTGTGATTGGGAATAAATATGCCTCTC 
AAAGAAGAGAGAAGACCTTCTCGACCCCGGGAAGCCTCTTCAGGAGTGTGATTGGGAATAAATATGCCTCTC 
AAAGAAGAGAGAAGACCTTCTCGACCC - GGGAAGCCTCTTCAGGAGTGAGATTGGGAATAAATATGCCTCTC 



CTTTGTATATTATTTCTAGGAAGAATTTTAAAAATGAATCCTACACACTTAAGGGACATG 
CTTTGTATATTATTTCTAGGAAGAATTTTAAAAATGAATCCTACACACTTAAGGGACATG 
CTTTGTATATTATTTCTAGGAAGAATTTTAAAAATGAATCCTACACACTTAAGGGACATG 
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TTTTGATAAAGTAGTAAAAATTTAAAAAAATACTTT^ 

TTTTGATAAAGTAGTAAAAATTTAAAAAAATACTTTAATAAGATGACATTGCTAAGATGC 
TTTTGATAAAGTAGTAAAAATTTAAAAAA- TACTTTAATAAGATGACATTGCTAAGATGC 

TCTATCTTGCTCTGTAATCTCGTTTCAAAAACAAGGTGTTTTTGTAAAGTGTGGCCCCAA 
TCTATCTTGCTCTGTAATCTCGTTTCAAAAACAAGGTGTTTTTGTAAAGTGTGGTCCCAA 
•l||TATCTTGCTCTGTAATCTCGTTT 

CAGGAGGACAATTCATGAACTTCGCATCAAAAG^^ 
GAGGAGGACAATTCATGAACTTCGCATCAAAAGACAATTCTTT^ 

CAGGAGG ACAATTCATGAACTT CG CATCAAAAGACAATTCTTT ATACL^CAGTGCT AAAA 

ATG 
ATG 
ATG 
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Proteinvergleich 



BB 
SHR 

Homo sapiens 



m^gdtlyiatdgsempaeivelheievetipvetiettwgee; 
masgdtlyiatdgsempaeivelheievetipvetiettwgee: 

MASGDTLYIATDGSEMPAEIVEIjHEIEVETIPVETIETTVVGEE: 




iDEDGGGGDB 
©EDGGGGDHGGG 
©EDGGGGDHGGGG* 




HAGHHHHHHHHHH 
BHAGHHHHHHHHHH 
GHAGHHHHHHHHHH 



|p£PMIALQPLVTDDPTQVHHHQEV^ 

||^PPMIALQPLVTDDPTO 

IjsHPPMIALQPLVTDDPTQV^ 




;S S GGGRVKKGGGKKSGKKS YD 
SSGGGRVKKGGGKKSGKKS 
SGGGRVKKGGGKKSGKKSYL< 



|GAGAAGGGGADPGNKKWEQKQVQIKTLEGEpS 
:>PGNKKWEQKQVQIKTIjEGlfe 
^GAAGGGGADPGNK3CWEQKQVQIKTIjEGE§S VTMWS SDEKKDIDHETWEE 




GENSPPDYSEYMTGKKIiPPGGIPGIDLSDPKQIjAEFARMKPRK^ 
QIIGENSPPDYSEYMTGKKLPPGGIPGIDLSDPKQIiAEFARMKPRK^ 
QIIGENSPPDYSEYMTGKKLPPGGIPGIDLSDPKQIiAEFARMKPRKIKEDDAPRTIA 



*Zinkf inger 

CPHKGCTKjgFRDNSAI^KHLHT^^ 

CPHKGCTKj§FRDNSAI^^ 

CPHKGCTKS|FRDNSAM|b^^ 

Zinkf inger* 
TGDRP YVC PFDGCNKKFAQS TNLKSHILTH 
TGDRPYVCPFDGCNKKFAQST2nTIjKSHILTH 
TGDRPYVCPFDGCNKKFAQSTNLKSHILTH 




AKAKNNQ* 
AKAKNNQ* 
AKAKNNQ* 



=411/414 
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Yyl- Primer 



Bezeichnung 


Position 


Primers equenz en 


K823-F (Promo tor) 




CAC AGG CGT TTC TCG TCA GAG 


K825-R (Promoter) 




AAT ACC AAC TCC TCA ACC CCG A 


K884-F 


-104 


CTT CCT CCC TCT GCC TTC CTT 


K801-F 


55-75 


GAG ATC GTG GAA CTG CAT GAG j 


K827-R 


127-150 


GTC TTC GTC GTC GTC CTC CTC CTC 


K814-F 


417-437 


CGG AGA CGA CGA CTA CAT CGA 


K806-R 


428-452 


GTG ACC AGC GTC TGC TCG ATG TAG T 


K804-R 


529-550 


CCA GGT AAC TCT TCT TGC CGC 


K805-R 


589-610 


G TT CCC ACT TCT TAT TAC CCG G 


K828-F 


627-648 


CAA GAC CCT GGA GGG CGA GTT C 


K830-F 


697-721 


AGA GTG GTT GAA GAG LLAii AIL All \a 


^829-R 


690-722 


CCA ATG ATC TGC TCT TCA ACC AC 




839-866 


GCC AAG AAA AAT TAA AGA AGA TGA TGC 


12-R 


856-881 


GCT ATT GTT CTT GGA GCA TCA TCT TC 


■5-F 


997-1021 


GAG AGC TCA AAG CTA AAA CGA CAC C 


i^3-R 


1026-1050 


AAA GGG CTT TTC TCC AGT ATG AAC C 


K817-R 


1077-1099 


AAT. TGA AGT CCA GTG AAA AGG GC 


K816-F 


1105-1126 


ACG CAT GTG CGA ATC CAT ACC G 


K870-R 


1346-1372 


CAA AAC ATG TCC CTT AAG TGT GTA GGA 


K818-R 


1501-1528 


AAT TGT AAG CAA CAG GTG AGC TTC ATG 


K821-F (Intron 3) 




GCG AAG CAC CCC CAC ACT AAA TTT C 


K874-F (Intron 3) 




GCT TAT AAG TGC TGT TGG CTA CAG CT 


K875-R (Xntron 3) 




GTC ACC TGG AGC TGT AGC CAA C 



1 



Fl 
F2 
F3 
F4 
F5 
F6 
F7 
F8 
9 

10 
11 
F12 
F13 
F14 
F15 
F16 
F17 
F18 
F19 
F20 
F21 
F22 
F23 
F24 
F25 
F26 
F27 
F28 
F29 
F30 



10 
12 
12 
14 
15 
17 
19 
22 
23 
24 
26 
27 
29 
30 
30 
30 
34 
35 
36 
37 
39 
41 
41 
41 
41 
42 
43 
43 
43 
49 



1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
2 
1 
1 
1 
1 
1 
2 
1 
1 
1 
1 
2 
1 
1 
2 
1 
1 
1 



TCACTGGACTTCAATTTGCGC (1084) 

TTTTCACTGGACTTCAATTTGCG (1081) 

ACCAGATCCTCATTCCGGTACC (383) 

CCCTTTCAGTGCACATTCGAA (1045) 

GACGACGAAGACGACGAGGAT (139) 

GAGAGCTCAAAGCTAAAACGACACC ( 997 ) 

GGAGACGACGACTACATCGAGC (418) 

CGGAGACGACGACTACATCGA (417) 

TGAGAGCTCAAAGCTAAAACGACAC (996) 

GAGGACCAGATCCTCATTCCG (379) 

AACTCCCTCCTGGAGGGATACC (767) 

GAGACGACGACTACATCGAGCAG (419) 

GAGGAGGACGACGACGAAGAC (130) 

TTGAGAGCTCAAAGCTAAAACGACA ( 995 ) 

ACCCTCTACATTGCCACGGAC ( 16 ) 

ACTACATCGAGCAGACGCTGGT (428) 

GAGCTCAAAGCTAAAACGACACCA (999) 

TTCAGTGCACATTCGAAGGCT (1049) 

TGGAGACTATCGAGACCACGGT (98) 

TTTCAGTGCACATTCGAAGGC *( 1 0 4 8 ) 

GTGCGAATCCATACCGGAGAC { 1111 ) 

GAGGTGATTCTGGTGCAGACG (301) 

ACTCCCTCCTGGAGGGATACCT (768) 

GTGGAGACTATCGAGACCACGG (97) 

AGAGGTGATTCTGGTGCAGACG (300) 

TGAAATCTCACATCTTAACACACGCT (1190) 

TACATCGAGCAGACGCTGGTC (430) 

ACGACTACATCGAGCAGACGCT (425) 

GAAACTCCCTCCTGGAGGGATAC (765) 

CTGCACAAAGATGTTCAGGGATAAC (897) 
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F31 


52 


1 


AAAACGACACCAGCTGGTTCATAC 


(1011) 


F32 


52 


1 


TAAAACGACACCAGCTGGTTCATAC 


(1010) 


F33 


53 


1 


AGAAGAGCGGCAAGAAGAGTTACC 


(524) 


F34 


53 


1 


ACCTGAAATCTCACATCTTAACACACG 


(1187) 


F35 


53 


1 


CCTGAAATCTCACATCTTAACACACG 


(1188) 


F36 


55 


1 


GACACCAGCTGGTTCATACTGGA 


(1016) 


F37 


55 


2 


GGTGGAGACTATCGAGACCACG 


(96) 


F38 


55 


1 


AGACGACGAC TACATCGAGCAGA 


(420) 


F39 


57 


1 


CAGTGGTTGAAGAG CAGAT CATTG 


(698) 


F4 0 


57 


1 


ACAGTGGTTGAAGAGCAGATCATTG 


(697) 


F41 


57 


1 


GGTTGAAGAGCAGATCATTGGG 


(702) 


F42 


58 


1 


GGTCCCAGAGTCCACGTCTGT 


(952) 


F43 


59 


1 


TGCACAAAGATGTTCAGGGATAACT 


(898) 


F44 


60 


1 


GATGCTCCAAGAACAATAGCTTGC 


(862) 


F45 


62 


1 


GTCCCAGAGTCCACGTCTGTG 


(953) 


F46 


67 


1 


GCTTTTCACTGGACTTCAATTTGC 


(1079) 


F47 


67 


1 


AGTGGTTGAAGAG CAGAT CATTGG 


(699) 


JF4 8 


67 


1 


GTGGTTGAAGAGCAGATCATTGG 


(700) 




71 


1 


AGAGCGGCAAGAAGAGTTACCTG 


(527) 


m - 


71 


1 


TCACATCTTAACACACGCTAAAGCC 


(1197) 




72 


1 


ATCTCACATCTTAACACACGCTAAAGC 


(1194) 




73 


1 


CTGAAATCTCACATCTTAACACACGC 


(1189) 


F53 


74 


1 


ACGACACCAGCTGGTTCATACTG 


(1014) 


F54 


76 


1 


AGATATTGACCATGAAACAGTGGTTGA 


(681) 


F55 


76 


1 


GATATTGACCATGAAACAGTGGTTGA 


(682) 


F56 


76 


1 


GAGGGATACCTGGCATTGACCT 


(779) 


F57 


77 


1 


AGACCATCCCGGTGGAGACTAT 


(86) 


F58 


78 


1 


GAAGAGCGGCAAGAAGAGTTACCT 


(525) 


F59* 


78 


3 


GGAGACTATCGAGACCACGGTG 


(99) 


F60 


82 


1 


GGTTCGAGGACCAGATCCTCA 


(374) 


F61 


83 


2 


GAG CAGAT CATTGGGGAGAACTC 


(709) 


F62 


87 


1 


GAAGATGATGCTCCAAGAACAATAGC 


(856) 


F63 


88 


1 


CGCTAAAGCCAAAAACAACCAGT 


(1212) 


F64 


88 


1 


ATACCGGAGACAGGCCCTATGT 


(1121) 


F65 


89 


1 


CAATAGCTTGC C CTCATAAAGGC 


(875) 


F66 


89 


1 


AAGATATTGACCATGAAACAGTGGTTG 


(680) 


F67 


89 


1 


ACAATAGCTTGC CCTCATAAAGGC 


(874) 


F68 


92 


1 


AGAAAAGCCCTTTCAGTGCACA 


(1038) 


F69 


95 


1 


ATATTGACCATGAAACAGTGGTTGAAG 


(683) 


to?7 0 


95 


1 


GCGGCAAGAAGAGTTACCTGG 


.(530) 


JF71 


95 


1 


TATTGACCATGAAACAGTGGTTGAAG 


(684) 


F72 . 


95 


1 


ATTGACCATGAAACAGTGGTTGAAG 


(685) 


F73 


95 


1 


TTGACCATGAAACAGTGGTTGAAG 


(686) 


F74 


96 


1 


GAACAATAGCTTGCCCTCATAAAGG 


•(872) 


F75 


96 


1 


AGAACAATAGCTTGCCCTCATAAAGG 


(871) 


F76 


98 


1 


ACCTCTCAGACCCCAAGCAACT 


(797) 


F77 


99 


. 1 


ACGCTAAAGCCAAAAACAAC CAG 


(.1211) ' 


F78 


101 


1 


AAGATGATGCTC CAAGAACAATAGCTT 


(857) 


F79 


101 


1 


AAACGACACCAGCTGGTTCATACT 


(1012) 


F80 


102 


1 


CGACGGTTGTAATAAGAAGTTTGCTC 


(1152) 


F81 


103 


1 • 


CAAGAACAATAGCTTGCCCTCATAAA 


(869) 


F82 


103 


1 


GGAACAGAAGCAGGTGCAGATC 


(606) 


F83 


106 


1 


AAAAGCCCTTTCAGTGCACATTC 


(1040) 


F84 


106 


2 


TCTGCTATGAGAAAGCATCTGCAC 


(922) 


F85 


106 


1 


AAACAGTGGTTGAAGAGCAGATCATT 


. (695) 


F86 


106 


1 


TTCGACGGTTGTAATAAGAAGTTTGC 


(1150) 


F87 


106 


1 


AGCGTTCGTTGAGAGCTCAAAG 


(987) 


F88 


106 


1 


GCCCCTTCGACGGTTGTAATA 


(1145) 


F89 


107 


1 


CAACTGGCAGAATTTGCCAGA 


(814) 


F90 


107 


1 


AGTTCTCGGTCACCATGTGGTC 


(644) 


F91 


108 


1 


TGAGAAAGCATCTGCACACCC 


(929) 
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ATGAGAAAGCATCTGCACACCC 

TATGAGAAAGCATC TGCACACC C 

GAGTTCTCGGTCACCATGTGGT 

CACCACCACCAAGAGGTGATTC 

GACGACGACTACATCGAGCAGAC 

CCCGGTGGAGACTATCGAGAC 

CAGAAGCAGGTGCAGATCAAGAC 

GCTAAAGCCAAAAACAACCAGTGA 

GACCTCTCAGACCCCAAGCAA 
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27 
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29 
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29 
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R4 0 
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33 
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R45 


33 
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R4 6 


34 


1 


R4 7 


34 


2 


R48 


34 


2 


R49 


35 


1 



GCAAACTTCTTATTACAACCGTCGAA 

ACATAGGGCCTGTCTCCGGTAT 

AGCAAACTTCTTATTACAACCGTCGA 

AGCTTTGAGCTCTCAACGAACG 

GAGCAAACTTCTTATTACAACCGTCG 

CTTTGAGCTCTCAACGAACGCT 

GGTTGTTTTTGGCTTTAGCGTGT 

CTGGTTGTTTTTGGCTTTAGCGT 

CCTGTCTCCGGTATGGATTCG 

CTGTCTCCGGTATGGATTCGC 

GTCTCCGGTATGGATTCGCAC 

AGCGTCTGCTCGATGTAGTCGT 

TTCTGTTCCCACTTCTTATTACCCG 

TCTGCTCGATGTAGTCGTCGTCT 

ACTGGTTGTTTTTGGCTTTAGCG 

GTCTGCTCGATGTAGTCGTCGTC 

ATCCTCGTCGTCTTCGTCGTC 

CAGTATGAACCAGCTGGTGTCGT 

TTGAGC TCTCAACGAACGCTTT 

AGACCACATGGTGACCGAGAAC 

CTTCTTATTACCCGGGTCGGC 

CTGCTCGATGTAGTCGTCGTCTC 

TCGATGTAGTCGTCGTCTCCG 

TTTGAGCTCTCAACGAACGCTT 

CCACTTCTTATTACCCGGGTCG 

CACTTCTTATTACCCGGGTCGG 

GACCAGCGTCTGCTCGATGTA 

AATTGAAGTCCAGTGAAAAGCGC 

TGAACCAGCTGGTGTCGTTTTAG 

GACCACATGGTGAC CGAGAACT 

AACTTC TTATTACAAC CGT CGAAGGG 

TGTTCCCACTTCTTATTACCCGG 

CCCAGGTAACTCTTCTTGCCG 

AGAGGTCAATGCCAGGTATCCC 

CCAGGTAACTCTTCTTGCCGC 

TTGAAGTCCAGTGAAAAGCGCT 

TGAGGATCTGGTCCTCGAACC 

CACATGGTGACCGAGAACTCG 

GTATGAACCAGCTGGTGTCGTTTT 

TCAATCTCATGCAGTTCCACGAT 

TCAATCTCATGCAGTTCCACGA 

AGTATGAACCAGCTGGTGTCGTTT 

GGTCTCGATAGTCTCCACCGG 

AAGACCACATGGTGACCGAGAA 

CAATCTCATGCAGTTCCACGATC 

GGAATGAGGATCTGGTCCTCG 

TTCCCACTTCTTATTACCCGGGT 

TGAAGTCCAGTGAAAAGCGCTT 

GCTCGATGTAGTCGTCGTCTCC 
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R50 


36 
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GTATGAACCAGCTGGTGTCGTTTTA 


(1034) 


R51 


36 


1 


TTCCCACTTCTTATTACCCGGG 


(609) 


R52 
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GAATGAGGATCTGGTCCTCGAAC 


(397) 


R53 


43 
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GAGGTCAATGCCAGGTATCCCT 


(801) 


R54 


44 


1 


GTGGTCTCGATAGTCTCCACCG 


(116) 


R55 


44 
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AGGTAACTCTTCTTGCCGCTCTTC 


(548) 


R56 


45 
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CACATTCTGCACAGACGTGGA 


(982) 
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46 
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AAAGGGCTTTTCTCCAGTATGAACC 


(1050) 


R58 


47 
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ACCATCCTCGTCGTCTTCGTC 


(162) 


R59 


48 


1 


GCTTCTGTTCCCACTTCTTATTACCC 


(616) 


R60 


48 


1 


CACATTCTGCACAGACGTGGAC 


(982) 


R61 


49 


1 


CAGGTAACTCTTCTTGCCGCTCT 


(549) 


R62 


49 


1 


GATGCTTTCTCATAGCAGAGTTATCCC 


(940) 


R63 


49 


1 


CTGAAGACCACATGGTGACCG 


(670) 


R64 


50 


2 


CCTGCTTCTGTTCCCACTTCTTATTAC 


(619) 


R65 


52 


1 


ACCAGCGTCTGCTCGATGTAGT 


(449)' 


R66 


53 


1 


TCTTATTACAACCGTCGAAGGGG 


(1168) 


^^^^67 


53 


1 


TTGTTTTTGGCTTTAGCGTGTGTT 


(1229) 




54 


1 


ACTGAAAGGGCTTTTCTCCAGTATG 


(1054) 


- V . 1 K 


55 


1 


CACTGAAAGGGCTTTTCTCCAGTAT 


(1055) 




57 


1 


GAGGTGAGTTCTCCCCAATGATC 


(736) 




58 


1 


GGTACCGGAATGAGGATCTGGT 


(404) 


R72 


62 


1 


GTCTCGATAGTCTCCACCGGG 


(113) 


R73 


63 


1 


CTTCAACCACTGTTTCATGGTCAATA 


(709) 


R74 


64 


1 


CCTTTATGAGGGCAAGCTATTGTTC 


(896) 


R75 


64 


1 


CTTC^VACCACTGTTTCATGGTCAATAT 


(709) 


R76 


65 


1 


TTTTTGGCTTTAGCGTGTGTTAAGAT 


(1226) 


R77 


66 


1 


TTGTTTTTGGCTTTAGCGTGTGTTA 


(1229) 


R78 


69 


1 


CTTGGGGTCTGAGAGGTCAATG 


(813) 


R79 


71 


1 


GTCCGTGGCAATGTAGAGGGT 


(36) 


R80 


71 


1 


TCTGGCAAATTCTGCCAGTTG 


(834) 


R81 


72 


1 


TCACTGGTTGTTTTTGGCTTTAGC 


(1236) 


R82 


72 


1 


CTTTGTGCAGCCTTTATGAGGG 


(906) 


R83 


73 


1 


GTTGTTTTTGGCTTTAGCGTGTGT 


(1230) 


R84 


74 


1 


TGAAAGGGCTTTTCTCCAGTATGA 


(1052) 


R85 


75 


1 


GCAAGCTATTGTTCTTGGAGCATC 


(885) 


R86 


76 


1 


GCCTTTATGAGGGCAAGCTATTG 


(897) 


R87 


76 


1 


GCTTGGGGTCTGAGAGGTCAAT 


(814) 


^^^R88 


76 


1 


CCAATGATCTGCTCTTCAACCAC 


(722) 
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77 


1 


CCACCGTGGTCTCGATAGTCTC 


(121) 


«90 
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1 


CTGCTTCTGTTCCCACTTCTTATTACC 


(618) 
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1 


TTGGCTTCATTCTGGCA2\ATTC 


(844) 
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1 . 


CTTCAACCACTGTTTCATGGTCAAT 
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AATCTCATGCAGTTCCACGATCTC 
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R94 
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CTTCAACCACTGTTTCATGGTCAA 
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R95 
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GGGCTTTTCTCCAGTATGAACCA 


(1047) 


R96 
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ACCACATGGTGACCGAGAACTC 


(664) 


R97 
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1 


GTGCAGATGCTTTCTCATAGCAGA 


(945) 
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TGTGCAGATGCTTTCTCATAGCAG 


(946) 
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CATTCTGCACAGACGTGGACTC 
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TCTGAGAGGTCAATGCCAGGTATC 
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Verkurzter Zinkfinger von BB . 6S 

1. Nukleinsauresequenz des „verkurzten w Zinkfingers bei BB . 6S (die 
durchgestrichenen Nukleotide fehlen, nur die unterstrichenen 
Nukleotide kodieren fur Aminosauren des Proteins in der zweiten 
BaxLde) 

1 ATGGCCTCGG GCGACACCCT CTACATTGCC ACGGACGGCT CGGAGATGCC 
51 AGCCGAGATC GTGGAACTGC ATGAGATTGA GGTGGAGACC ATCCCGGTGG 
101 AGACTATCGA GACCACGGTG GTGGGCGAGG AGGAGGACGA CGACGAAGAC 
151 GACGAGGATG GTGGCGGCGG AGACCACGGT GGCGGGGGCG GCCACGGGCA 
201 CGCTGGCCAC CACCATCACC ACCACCACCA CCACCACCCG CCCATGATCG 
251 CGCTGCAGCC GCTGGTCACC GACGACCCGA CCCAAGTGCA CCACCACCAA 
301 GAGGTGATTC TGGTGCAGAC GCGCGAGGAG GTAGTGGGTG GCGACG AC TC 
351 GGACGGGCTG CGCGCCGAGG ACGGGTTCGA GGACCAGATC CTCATTCCGG 
401 TACCCGCGCC GGCCGGCGGA GACGACGACT ACATCGAGCA GACGCTGGTC 
451 ACCGTGGCGG CGGCCGGCAA GAGCGGTGGC GGGTCTTCGT CGGGCGGCGG 
501 CCGCGTTAAG l^AGGGCGGCG GCAAGAAGAG cGGCAAGAAG AGTTACCTGG 
551 GCAGCGGGGC CGGCGCGGCG GGCGGTGGCG GCGCCGACCC GGGTAATAAG 
601 AAGTGGGAAC AGAAGCAGGT GCAGATCAAG ACCCTGGAGG GCGAG TTCTC 
651 GGTCACCATG TGGTCTTCAG ATGAAAAAAA AGATATTGAC CATGAAACAG 
7 01 TGGTTGAAGA GCAGATCATT GGGGAGAACT CACCTCCTGA TTATTCTGAA 
751 TATATGACAG GCAAGAAACT CCCTCCTGGA GGGATACCTG GCATTGACCT 
801 CTCAGACCCC AAGCAACTGG CAGAATTTGC CAGAATGAAG CCAAGAAAAA 
851 TTAAAGAAGA TGATGCTCCA AGAACAATAG CTTGCCCTCA TAA A GGCTCC 
901 ACAAACAtCT T CAC G CAT AA CTCTGCTATG AgAAAOCATC TCCACACCCA 
951 CCGTCCCAGA CTCCACGTCT GTGCAGAATG TCCCAAACCC TTCCTTG AGA 
1001 G CTCAAAG CT AAAACCACAC CAG CTCGTTC ATACTCCACA AAAGCCCTTT 
1051 CAGTGCACAT TCGAAGGCTG CGGGAAGCGC TTTTCACTGG ACTTCAATTT 
1101 GCGCACGCAT GTGCGAATCC ATACCGGAGA CAGGCCCTAT GTGTGCCCCT 
1151 TCGACGGTTG TAATAAGAAG TTTGCTCAGT CAkCTAACCT GAAATCTCAC 
1201 ATCTTAACAC ACGCTAAAGC CAAAAACAAC CAGTGA 

2 . Proteinseguenz des „verkurzten" Zinkfingers bei BB . 6S (die 
durchgestrichenen Nukleotide fehlen, nur die unterstrichenen 
Nukleotide sind in der zweiten Bande vorhanden) : 

CPHK G ctkmfrdns a mrkhlhthoprvh V 

CAECGKAFVESSKLKRHQLVHTGEKPFQ 
CTFEGCGKRFSLDFNLRTHVPTTTTOBP PW 
CPFDG^NKKFAQSTN]LKSHILTH 



n=57 
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ErfindungsgemaS verwendete Anfci sense -Oligonukleo tide 

(Die angegebenen Positionen beziehen sich nur auf den kodierenden Bereich und 
entsprechen nicht den Positionsnummern im Seguenzprotokoll . ) 

>gi| 1835104 |emb|Z85393.l|HSZ85393 H. sapiens Ig lambda light chain variable 
region gene (34-30SWIIE197) rearranged; Ig- Light -Lambda; VLambda 
Identities = 14/14 (100%) 

Query: 74 accggagcccgctg 88 

MINI MINIM 

Sbjct: 241 accggagcccgctg 228 
Vjregion 1 . .348 

8|ref |NM_000937.2 | Homo sapiens polymerase (RNA) II (DNA directed) 

A, 220kDa (POLR2A) , mRNA 
* 17/18 (94%) 

ggagcccgctgtgggaga 94 

iiniiii iiiiniii 

Sbjct: 5099 ggagcccggtgtgggaga 5082 
CDS 387.. 6299 

>gi | 18596386 | ref | XM_093190 . 1 | Homo sapiens similar to T-cell activation 
protein (LOC170226) , mRNA 
Identities = 20/21 (95%) 

Query: 76 cggagcccgctgtgggagatg 96 

MM 1 1 Ml I llllll MM 

Sbjct: 156 cggagcacgctgtgggagatg 176 
CDS 1..1314 

>gi|793457l|gb|AF220152.2|AF220152 Homo sapiens TACC2 mRNA, complete cds 
Identities = 14/14 (100%) 

ery: 78 gagcccgctgtggg 91 

iiiiiiiillilil 

ct: 977 gagcccgctgtggg 990 
CDS 293.. 3013 

>gi|6165844|gb|AF100772.l|AF100772 Homo sapiens tenascin-Ml (TNM1) mRNA, 
Identities = 16/16 (100%) 

Query: 79 agcccgctgtgggaga 94 

iiiiiiiiiiiiiiii 

Sbjct: 4377 agcccgctgtgggaga 4362 

CDS 65. . 8242 

function= "putative receptor molecule" 

>gi | 24496766 |ref |NM_004712.3 | Homo sapiens hepatocyte growth factor -regulated 
tyrosine kinase substrate (HGS) , mRNA 
Identities = 15/15 (100%) 

Query: 79 agcccgctgtgggag 93 

1 1 1 1 ! I [ 1 1 1 1 1 1 1 1 

Sbjct: 2 088 agcccgctgtgggag 2 074 




1458994 
eptide 
jLties 

77 



1 



CDS 78.. 2411 

/note= "human growth factor- regulated tyrosine kinase 

>gi| 4324953 | gb | AF114821 . 1 | HSSM03 Homo sapiens smoothened (SMO) gene, exons 3 
through 12 and complete 
Identities = 14/14 (100%) 

Query: 79 agcccgctgtggga 93 

1 1 MM II Mil II 

Sbjct: 6838 agcccgctgtggga 6825 
CDS 6833.. 6967 

>gi | 22064913 | ref |XM_090047 . 5 | Homo sapiens LOC160156 (LOC160156) , mRNA 
Identities = 14/14 (100%) 

Query: 80 gcccgctgtgggag 93 

IIIIIIIIMIIII 

Sbjct: 1427 gcccgctgtgggag 1440 
CDS 709.. 1980 

y 517388|emb|Z31606.l|HSB2NO3 H. sapiens brain-2/N-Oct 3 gene (promoter 
>n) 

ities = 15/15 (100%) 




80 gcccgctgtgggaga 94 

MMIMIIIIMM 

Sbjct: 547 gcccgctgtgggaga 561 
promoter 1. .670 

>gi|2327350l|gb|BC035782.l| Homo sapiens, Similar to tyrosine kinase, non- 
receptor , 1 , c lone 
Identities = 15/15 (100%) 

Query: 83 cgctgtgggagatgt 97 

IMMIIIMIIMI 

Sbjct: 1032 cgctgtgggagatgt 1046 
CDS 98. .2083 

>gi | 7662017 | ref |NM_015153 . 1 | Homo sapiens PHD finger protein 3 (PHF3), mRNA 
Identities = 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

I M 1 1 1 1 n 1 1 M i 

ct: 2228 gctgtgggagatgt 2241 
S 28.. 6147 

i | 20561197 | ref | XMJ)62302 . 3 | Homo sapiens similar to RING finger protein 18 
(Testis-specif ic ring-finger protein) (LOC120826) , mRNA 
Score =28.2 bits (14), Expect = 119 
Identities » 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

IIIIIIIIMIIII 

Sbjct: 489 gctgtgggagatgt 502 

CDS 190.. 2244 . 

/products similar to RING finger protein 18 (Testis-specif ic ring-finger rotem) 

>gi 1 4885330 | ref | NM_0053 05 . 1 1 Homo sapiens G protein- coupled receptor 42 

(GPR42) , mRNA 

Identities = 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

1 1 1 1 i 1 1 1 1 1 1 1 1 1 

Sbjct: 486 gctgtgggagatgt 473 

CDS 1- .1041 

>gi | 17473297 | ref | XM_061928 . 1 | Homo sapiens LOC120226 (LOC120226) , mRNA 



2 



Identities = 14/14 (100%) 

Query: 84 gctgtgggagatgt 97 

llllllilllllll 
Sbjct: 453 gctgtgggagatgt 466 
CDS 1- -492 

>gi | 21359977 | ref |NM_024947 . 2 | Homo sapiens polyhomeotic like 3 (Drosophila) 
(PHC3) , mKNA 

Identities = 14/14 (100%) 

Query: 85 ctgtgggagatgta 97 

llllllilllllll 
Sbjct: 404 ctgtgggagatgta 391 

CDS 65.. 2959 

/note= "early development regulator 3; polyhomeotic 3" 

>gi|l971881l|gb|BC007249.2| Homo sapiens, pelota homolog (Drosophila), clone 
Identities « 13/13 (100%) 

: 97 taacggtgcctgc 109 

iiiiiiiiniii 

: 1303 taacggtgcctgc 1291 
_ _JS 274. .1431 

/product = "pelota homolog (Drosophila)" 

>gi| 19924298 | ref |NM_004958 .2 | Homo sapiens FK506 binding protein 12-rapamycin 
associated protein l(FRAPl), mRNA 
Identities = 13/13 (100%) 

Query: 98 acggtgcctgccg 111 

IIIIIIIINIII 

Sbjct: 5720 acggtgcctgccg 5732 

CDS 80 7729 " 

/note=«FK506 binding protein 12-rapamycin associated protein 2; rapamycin target 
protein; FKBP12 -rapamycin complex-associated protein 1; FKBP-rapamycm 
associated 

>gi 1 22049727 | ref |XM_040948 . 8 | Homo sapiens dynein, cytoplasmic, heavy 
polypeptide 1 (DNCH1) , mKNA 
entities = 13/13 (100%) 

ry: 99 acggtgcctgccg 111 

iiiimimii 

Sbjct: 6291 acggtgcctgccg 63 03 

CDS 6.. 683 0 

/product=" similar to cytoplasmic dyne in heavy chain" 

>gi|459833|gb|L25085.l|HTOlSEC61B Human Sec61-complex beta-subunit mRNA, 
Identities = 14/14 (100%) 

Query: 100 cggtgcctgccgag 113 

llllllilllllll 
Sbjct: 22 0 cggtgcctgccgag 207 

CDS 64.. 354 

/function= "protein translocation across the er-membrane" 

>gi 1 21704280 | ref | NM_020433 . 2 | Homo sapiens junctophilin 2 (JPH2) , mRNA 
Identities = 17/18 (94%) 

Query: 100 cggtgcctgccgagcctc 117 



Sbjct: 2526 cggtgcctgcagagcctc 2509 

CDS 874.. 2964 

mediate cross talk between cell surface and intracellular ion channels. 

>gi | 12804622 | gb | BC001734 .l|BC001734 Homo sapiens, protein translocation 
complex beta, clone MGC:1255 
Identities = 14/14 (100%) 

Query: 100 cggtgcctgccgag 113 

II Ml 1 1 1 II III I 

Sbjct: 233 cggtgcctgccgag 220 

CDS 77.. 367 

>gi | 22 053428 | ref | XM_038146 . 5 | Homo sapiens interferon, gamma -inducible protein 
30 (IFI30) , mRNA 
Identities = 16/17 (94%) 

Query: 100 cggtgcctgccgagcct 116 

1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 

■fcict: 289 cggtggctgccgagcct 305 

74.. 826 

i (Aict= n similar to Gamma- interferon inducible lysosomal thiol reductase 
JS rff^Brsor (Gamma-interferon-inducible protein IP-30) " 

>gi | 7657145 | ref | NMJ314365 . 1 1 Homo sapiens protein kinase Hll. (Hll) , mRNA 
Identities = 13/13 (100%) 

Query: 101 ggtgcctgccgag 113 

llillililini 

Sbjct: 763 ggtgcctgccgag 775 

CDS 524.. 1114 

/note=" contains hsp20/crystallin family domain; estradiol -induced; small stress 
protein-like protein HSP22" 

>gi| 21264316] ref |NM_014599. 3 | Homo sapiens melanoma antigen, family D, 2 
(MAGED2) , mRNA 
Identities = 17/18 (94%) 

Query: 101 ggtgcctgccgagcctct 118 

iiiiiii iiiiiiiiii 

Sbjct: 332 ggtgcctcccgagcctct 315 
CDS 97.. 1917 

te= "hepatocellular carcinoma associated protein; breast cancer associated 
e 1" 

i| 11967745 |emb|AJ293618.l|HSA293618 Homo sapiens mRNA for hypothetical 
protein 11B6, clone XP11B6 
Identities = 17/18 (94%) 
Query: 101 ggtgcctgccgagcctct 118 

IIIIIII IIIIIIIIII 

Sbjct: 248 ggtgcctcccgagcctct 231 

CDS * 13.. 1833 

>gi | 20514781 1 ref |NM_139015 . 1 1 Homo sapiens SPPL3 (SPPL3) , mRNA 
Identities = 14/14 (100%) 

Query: 104 gcctgccgagcctc 117 

IIIIIII IIIIIII 
Sbjct: 569 gcctgccgagcctc 582 

CDS 1. .1905 

/product= "hypothetical protein XP_068909" 

>gi| 23094385 |emb|ACT345030.l|HSA345030 Homo sapiens mRNA for presenilin-like 
protein 4 (PSL4 gene) 



Identities = 14/14 (100%) 
Query: 104 gcctgccgagcctc 117 

MINIUM MM 

Sbjct: 598 gcctgccgagcctc 611 

CDS 54.. 1208 

/functions "putative intramenibrane protease" 

>gi|4502840|ref |NM_003654 . 1 1 Homo sapiens carbohydrate (keratan sulfate Gal-6) 
sulfotransf erase 1 (CHST1) , mRNA 
Identities = 16/17 (94%) 

Query: 105 cctgccgagcctctacg 121 

MMI M 1 1 1 1 1 M 1 1 

Sbjct: 735 cctgcggagcctctacg 751 

CDS 367.. 1602 

/note=" carbohydrate (chondroitin 6/keratan) sulfotransf erase 1" 
/protein_id="NP_003645 .1" 

H 17485022 |ref | XM_066361 . 1 | Homo sapiens similar to glutathione S- 
sf erase theta 1 (IiOC129041) , mRNA 
iities s 13/13 (100%) 
y: 105 cctgccgagcctc 117 

1 1 i l i 1 1 ! 1 1 i 1 1 

Sbjct: 580 cctgccgagcctc 568 

CDS 1. . 633 

/product= "similar to glutathione S-transf erase theta 1" 

>gi| 22134527 |gb|AF331523.l| Homo sapiens chromosome 12 putative anion 
transporter mRNA, partial 
Identities = 13/13 (100%) 

Query: 106 ctgccgagcctct 118 

IMMMMMM 

Sbjct: 807 ctgccgagcctct 819 

CDS <312..2003 
note= "member of the SLC26 family; 

>gi 1 14784297 | ref | XM_031102 . 1 1 Homo sapiens Breakpoint cluster region protein, 
erine leiomyoma, 2 (BCRP2) , mRNA 
tities = 13/13 (100%) 

ery: 108 gccgagcctctac 120 

II I II 1 1 1 M II I 

Sbjct: 1784 gccgagcctctac 1796 

CDS 55.. 2883 

/product^ "similar to KIAA1824 protein" 

>gi | 20535791 1 ref | XMJL19632 . 1 1 Homo sapiens LOC205318 (LOC205318) , mRNA 
Identities = 14/14 (100%) 

Query: 123 tcggctctagcacc 136 

MlillllllMII 

Sbjct: 491 tcggctctagcacc 504 

CDS 1. .522 

/products "hypothetical protein XP__119632" 

>gi 1 4557448 | ref |NM_001271 . 1 1 Homo sapiens chromodomain helicase DNA binding 
protein 2 (CHD2) , mRNA 
Identities = 14/14 (100%) 



5 



Query: 125 ggctctagcacctt 138 

I I I I II I I I I I I I I 
Sbjct: 2791 ggctctagcacctt 2778 
CDS 708. .5927 

/product="chromodomain helicase DNA binding protein 2" 

>gi | 21264574 | ref |NM_139135 . 1 1 Homo sapiens SWl/SNF related, matrix- associated, 
actin dependent regulator of chromatin, subfamily f , member 1 (SMARCF1) , 
transcript variant 2, mRNA 
Identities « 14/14 (100%) 

Query: 128 tctagcaccttgac 141 

- i in n'l 1 1 ii ill 

Sbjct: 5474 tctagcaccttgac 5487 

CDS 371.. 6577 

/note- "brain protein 12 0; chromosome 1 open reading frame 4; SWl/SNF complex 
protein p270; BRG1- associated factor 250a; chromatin remodeling factor p250; 
OSA1 nuclear protein" 

8129612 |gb|AF333072*. 2 |AF333072 Homo sapiens HERV-K18.1 5« long terminal 
t, complete sequence; gag protein (gag) gene, gag-K18 . 1 allele, complete 
pol protein (pol) gene, pol-K18.1 allele, complete cds; env protein (env) 
e, env-K18.1 allele, complete cds; and 3' long terminal repeat, complete 
sequence 

Identities = 17/18 (94%) 



1 

e, 



t< 



Query: 143 tactctaactccacctct 160 

iiiiniiiiii inn 

Sbjct: 1196 tactctaactccccctct 1179 

CDS 1113.. 1874 

>gi|4503778 | ref |NM_002029 . 1 1 Homo sapiens formyl peptide receptor 1 (FPR1) , 
Identities = 14/14 (100%) 

Query: 14 8 taactccacctctg 161 

1 1 1 i 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1102 .taactccacctctg 1089 

CDS 62 . . 1114 

/product-" formyl peptide receptor 1" 

/product- "protein tyrosine kinase- 7 n ...... 

-i|21655145 |gb|AY082886.l| Homo sapiens eukaryotic translation initiation 

tor 4GI (EIF4GI) 
tities = 14/14 (100%) 



Query: 150 actccacctctggt 163 

1 1 n i i n 1 1 n 1 1 1 

Sbjct: 1400 actccacctctggt 1387 
CDS 275.. 5077 

>gi 1 13357213 | ref |NM_015545 . 1 1 Homo sapiens KIAA0632 protein (KIAA0632) , mRNA 
Identities = 17/18 (94%) 

Query: 152 tccacctctggtagggcc 169 

iiniiniiii inn 

Sbjct: 931 tccacctctggttgggcc 914 

CDS 282.. 1790 

/product="KIAA0632 protein" 

>gi|l8182862|gb|BC015632.l| Homo sapiens, similar to hypothetical protein 
XP_16654l, clone 
Identities = 18/19 (94%) 



Query: 153 ccacctctggtagggccac 171 

lllllil iiiiiiiiiii 

Sbjct: 2098 ccacctcgggtagggccac 2080 
CDS 52 . . 2517 

>gi | 24432033 | ref |NM_004959 . 3 | Homo sapiens nuclear receptor subfamily 5, group 
A, member 1 (NR5A1) , 
Identities = 17/18 (94%) 

Query: 159 ctggtagggccacctctg 176 

Mil lllllllllllll 

Sbjct: 2316 ctgggagggccacctctg 2299 
CDS 52,. 13776 

>gi|l7432414|gb|AF447167.l|F447157S05 Homo sapiens protein tyrosine kinase-7 
(PTK7) gene, exons 11, 12, and 13 
Identities = 15/15 (100%) 

Query: 161 ggtagggccacctct 175 

- Mill IIIIIII I II 

553 ggtagggccacctct 567 
F447164.1: 548. .683 



^^^198 



>882212|re£|NM_032119.l| Homo sapiens very large G protein- coupled 
receptor 1 (VLGR1) , mRNA 
Identities = 17/18 (94%) 

Query: 17 0 acctctgatagctctggt 187 

iiiiiiuii iiiiiii 

Sbjct: 11300 acctctgataactctggt 11283 
CDS 97. .19020 

>gi|22044294|ref|XM_17'4449.l| Homo sapiens LOC255281 (LOC2552 81) , mRNA 
Identities = 16/16 (100%) 

Query: 180 cctctgatagctctgg 196 

iiiiiiiiimim 

Sbjct: 460 cctctgatagctctgg 445 
CDS 1..474 

i 1 1841544 | gb | U89337 . 1 1 HSMHC3W36A Homo sapiens HIA cl ^ S ^J I ^^g° n (CREB _ RP ) 
iaining NG7 , cAMP response element binding protein- related protein (CREB RP) 

tenascin X genes, 
dentities = 17/18 (94%) 

Query: 180 gctctggtgccaccaccc 197 

iiiiiiiiiii linn _ 

Sbjct: 54778 gctctggtgcctccaccc 54795 
CDS 54566. .54883 



>gi|61S4703|gb|M-167572.l| A F167572 Homo sapiens protein methyltransf erase 
(JBP1) mRNA, complete cds 
Identities « 14/14 (100%) 

Query: 181 ctctggtgccacca 194 

U MM I M ill 1 1 

Sbjct: 574 ctctggtgccacca 561 

CDS 92.. 2005 t 

/function=»methylates histones H2A and H4 and myelin basic 




/product = "protein methyltransf erase" 

gi|2323409|gb|AF015913.l|AF015913 Homo sapiens SKBlHs mRNA, complete cds 
Identities = 14/14 (100%) 

Query: 181 ctctggtgccacca 194 

iiiiiiiiiiiiii 

Sbjct: 483 ctctggtgccacca 470 

CDS 1. .1914 

/note="homolog of fission yeast Skbl" 

>gi | 18490998 | ref |NM_003882 . 2 | Homo sapiens WNT1 inducible signaling pathway 
protein 1 (WISP1) , transcript variant 1, mRNA 
Identities = 18/19 (94%) 

Query: 181 ctctggtgccaccacccgc 199 

llllllllll MINIM 

Sbjct: 569 ctctggtgcccccacccgc 587 
CDS 77.. 1180 

,14245731 | dbj |AB051853.l| Homo sapiens ARHGAP9 gene for rho-GTPase 
ating protein, complete 
ities = 15/15 (100%) 

Query: 181 ctctggtgccaccac 195 

IIIIIIIMIIMII 

Sbjct: 2013 ctctggtgccaccac 2027 

CDS 140.. 2335 

/function^" regulating adhesion of hematopoietic cells to 
extracellular matrix" 

>gi| 16876446 | ref |NM_054028.l| Homo sapiens acy 1 -malony 1 condensing enzyme 
(AMAC) , mRNA 

Identities = 14/14 (100%) 
Query: 181 ctctggtgccacca 194 

iiiiiiiiiiiiii 

Sbjct: 220 ctctggtgccacca 233 
CDS 122. .1138 

i | 18594399 | ref | XM_092954 . 1 | Homo sapiens similar to acidic protein rich in 
ucines (LOC164697) , mRNA 
entities = 14/14 (100%) 

Query: 182 tctggtgccaccac 195 

I I I I I I I I I I I I I I 
Sbjct: 721 tctggtgccaccac 734 
CDS 1. .2454 

/products "similar to acidic protein rich in leucines" 

>gi | 20553841 1 ref | XM_031689 . 6 | Homo sapiens MAX dimerization protein 5 (MGA) , 
mRNA 

Identities = 14/14 (100%) 
Query: 182 tctggtgccaccac 195 

iiiiiiiiiiiiii 

Sbjct: 463 tctggtgccaccac 476 

CDS 82.. 4773 

/product^ 11 similar to MAX- interacting protein" 

>gi | 18575418 | ref | XM_100074 . 1 | Homo sapiens L0C15 94 80 (LOC159480) , mRNA 



Identities = 14/14 (100%) 
Query: 183 ctggtgccaccacc 196 

II Ml III MINI 

Sbjct: 475 ctggtgccaccacc 488 

CDS 1..1425 
/product^ "hypothetical protein XP_100074" 

>gi| 6912511 | ref |NM_012330 . 1 1 Homo sapiens monocytic leukemia zinc finger 
protein- related factor (MORF) , mRNA 
Identities = 14/14 (100%) 

t 

Query: 183 ctggtgccaccacc 196 

i mill i urn i 

Sbjct: 1535 ctggtgccaccacc 1548 

CDS 316.. 6537 

/notes" alternatively spliced? histone acetyltransf erase" 
/product= "monocytic leukemia zinc finger protein- related factor" 



1803221l|gb|AF217500.l|AF217500 Homo sapiens histone acetyltransf erase 
(M0Z2) mRNA, complete cds 
ities = 14/14 (100%) 



• 183 ctggtgccaccacc 196 

IIMIIMMIIII 

Sbjct: 17 08 ctggtgccaccacc 1721 

CDS 489. .6707 

/note= "MYST family member; similar to MOZ" 
/product^" hi stone acetyltransf erase M0Z2" 




>gi | 24497588 | ref |NM_139058 . 1 1 Homo sapiens aristaless related homeobox (ARX) , 
mRNA 

Identities = 15/15 (100%) 
Query: 185 ggtgccaccacccgc 199 

IMMIIIIIIMM 

Sbjct: 663 ggtgccaccacccgc 649 
CDS 1..1689 

>gi I 4758787 I ref |NM_00455i . l| Homo sapiens NADH dehydrogenase (ubiquinone) Fe- 
otein 3, 30kDa (NADH- coenzyme Q reductase) (NDUFS3) , mRNA 
Entities = 14/14 (100%) 

lery: 187 tgccaccacccgct 200 

1 1 1 MM 1 1 Mill 

Sbjct: 675 tgccaccacccgct 662 
CDS 13 . .807 

>product="bA171A24*.l (RAR-related orphan receptor B) " gene="RORB«/ 
Identities = 27/29 (93%) 

Ouerv: 189 ccaccacccgctcctcctcctgctgctgc 217 

11111111 I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ia<iw 

Sbjct: 140523 ccaccaccaactcctcctcctgctgctgc 140551 
CDS : 140352 . . >140970 

>gi |23510326 | ref |NM_015692.1 1 Homo sapiens alpha-2 macroglobulin family 
protein VIP (VIP) , mRNA 
Identities - 21/22 (95%) 

Query: 195 cccgctcctcctcctgctgctg 216 



Illllllll llllllllllll 

Sbjct: 47 cccgctcctgctcctgctgctg 68 

CDS 18.. 5675 

/note=" contains Kazal-type serine protease inhibitor domain" 

>gi I 21536391 1 ref |NM_007037.2 j Homo sapiens a disintegrin-like and 
metalloprotease (reprolysin type) with thrombospondin type 1 motif, 8 (ADAMTS8 ; , 
Identities = 29/32 (90%) 

Query: 196 ccgctcctcctcctgctgctgcttctgctgct 227 

iiiniii n iiiiiiniii mum 

Sbjct: 741 ccgctcctgctgctgctgctgctgctgctgct 772 
CDS 708.. 3380 

>gi | 7382453 | ref | NM_005199 . 3 | Homo sapiens cholinergic receptor, nicotinic, 
gamma polypeptide (CHRNG) , mRNA 
Identities = 22/23 (95%) 

Query: 196 ccgctcctcctcctgctgctgct 218 

inn iiiiiiiiiiiiniii 

: 19 ccgctgctcctcctgctgctgct 41 
1..1563 



~i 
e 



( 17738306|ref |NM_006650.2| Homo sapiens complexin 2 (CPLX2) , mRNA 
Identities = 18/18 (100%) 

Query: 197 cgctcctcctcctgctgc 214 

iiiliiiiiililillli 

Sbjct: 488 cgctcctcctcctgctgc 471 
CDS 346 . . 750 

>gij 21362089 1 ref |NM_032667 . 2 | Homo sapiens Bernardinelli-Seip congenital 
lipodystrophy 2 (seipin) (BSCL.2) , mKNA 
Identities = 24/26 (92%) 

Query: 198 gctcctcctcctgctgctgcttctgc 224 

mill inimi minim 

Sbjct: 1797 gctcctgctcctgcttctgcttctgc 1822 
CDS ~ 507.. 1901 

i | 21703365 | ref |NM_022766 . 3 | Homo sapiens ceramide kinase (CERK) , mRNA 
ntities = 21/22 (95%) 



ery: 198 gctcctcctcctgctgctgctt 219 

milium mmim 

Sbjct: 1216 gctcctcctccagctgctgctt 1195 
Identities = 14/14 (100%) 

Query: 204 cctcctgctgctgc 217 

1 llllllllll III 
Sbjct: 1586 cctcctgctgctgc 1599 

CDS 124. .1737 

/note=" lipid kinase LK4" 

>gi| 10198655jreflNM_020547.il Homo sapiens anti-Mullerian hormone receptor, 
type II (AMHR2), mKNA 
Identities = 20/20 (100%) 

Query: 199 ctcctcctcctgctgctgct 218 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
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Sbjct: 544 ctcctcctcctgctgctgct 563 
CDS 79. .1800 

>gi| 7662013 | ref | NMJD 14745 . 1 1 Homo sapiens KIAA0233 gene product (KIAA0233) 
mRNA 

Identities = 30/32 (93%) 

Query: 199 ctcctcctcctgctgctgcttctgctgctcct 230 

Ml II III I III I! , lll'l III lllllll 

Sbjct: 803 ctcctcctcctgctgctgctgctgatgctcct 772 
CDS 3.. 6110 

>gi|4504382|ref |NM__001528.l| Homo sapiens HGF activator (HGFAC) , mRNA 
Identities = 27/28 (96%) 

Query: 199 ctcctcctcctgctgctgcttctgctgc 226 

iiiiliniiilllilllll lllllll 

Sbjct: 64 ctcctcctcctgctgctgctgctgctgc 91 
CDS 4.. 1971 



3111046 I ref I NM 152227. l| Homo sapiens sorting nexin 5 (SNX5) , transcript 



t 1, mRNA 
lities = 18/18 (100%) 

Query: 200 tcctcctcctgctgctgc 217 

iiimiiiimiim 

Sbjct: 221 tcctcctcctgctgctgc 204 
CDS 181. .1395 

>gi | 22507392 | ref |NM_022574 . 2 | Homo sapiens PERQ amino acid rich, with GYF 
domain 1 (PERQ1) , mRNA 
Identities = 2 8/31 (90%) 

Query: 200 tcctcctcctgctgctgcttctgctgctcct 230 

iiiiiiiiiiii n iiimui inn 

Sbjct: 1856 tcctcctcctgccgccgcttctgctcctcct 1826 
CDS 236. .2689 

>gi 1 10834965 | ref |NM_000404 . 1 1 Homo sapiens galactosidase, beta 1* (GLBl) , 
transcript variant 179423, mRNA 
dentities = 26/28 (92%) 

ry: 200 tcctcctcctgctgctgcttctgctgct 227 

lllllll I I III II I I I II I Mil I I 
Sbjct: 83 tcctccttctgctgctggttctgctgct 110 

sigjpeptide 61 . . 129 

CDS 61. .2094 

>gi|l814019|gb|U84408.l|HSU84408 Human IL-1 receptor related protein MyD88 
mRNA, complete cds 
Identities = 20/20 (100%) 

Query: 201 cctcctcctgctgctgcttc 220 

iiiiiniiinninin 

Sbjct: 43 3 cctcctcctgctgctgcttc 414 
CDS 61.. 951 

>gi|l5929589|gb|BC015219.l|BC015219 Homo sapiens, HBV associated factor, clone 
Identities = 25/27 (92%) 

Query: 2 01 cctcctcctgctgctgcttctgctgct 227 
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hum mmimiii nun 

Sbjct: 1211 cctcctgctgctgctgcttccgctgct 1185 
CDS 434.. 1966 

>gi|4885332|ref |NM_005306 . 1 1 Homo sapiens G protein- coupled receptor 43 
(GPR43), mKNA 
Identities = 22/23 (95%) 

Query: 201 cctcctcctgctgctgcttctgc 223 

iimiiiimiiiiii mi 

Sbjct: 165 cctcctcctgctgctgctgctgc 187 
CDS 1..993 

/note="7tm_l; Region: 7 transmembrane receptor (rnodopsm 
family) " 

>gi 1 19111149 | ref | NMJL33265 . 1 1 Homo sapiens angiomotin (AMOT) , mRNA 
Identities = 24/26 (92%) 

Query: 202 ctcctcctgctgctgcttctgctgct 227 

inn minimi iiinin 

2448 ctccttctgctgctgctgctgctgct 2473 
797 . .2824 



11^4308357 | ref |NM_033253.1 1 Homo sapiens 5 ■ -nucleotidase, cytosolic IB 
(NT5C1B) , mRNA 
Identities = 24/26 (92%) 

Query: 2 03 tcctcctgctgctgcttctgctgctc 228 

mm iiiinin 1 1 1 i 1 1 1 1 1 

Sbjct: 678 tcctcccgctgctgctgctgctgctc 653 

CDS 482.. 1690 . _ _ ^ 

/note-"5« nucleotidase; autoimmune infertility- related protein; 5? -nucleotidase, 
cytosolic IB; cytosolic 5 - -nucleotidase IB; 5# -nucleotidase, cytosolic IB 

>gi | 11545760 | ref | NM_022055 . 1 | Homo sapiens potassium channel, subfamily K, 
member 12 (KCNK12) , 
Identities = 22/23 (95%) 

Query: 204 cctcctgctgctgcttctgctgc 226 

minimum mini 

>jct: 59 cctcctgctgctgctgctgctgc 81 
k DS 1..1293 
>te=" tandem pore domain potassium channel THIK-2" 




>gi | 5729946 | ref |NM_006681 . 1 1 Homo sapiens neuromedin D (NMD), mRNA 
Identities « 23/24 (95%) 

Query: 205 ctcctgctgctgcttctgctgctc 228 

llilllllllllil lllllini 

Sbjct: 169 ctcctgctgctgctgctgctgctc 192 

CDS 106. .630 

sig_j?eptide 106. .207 

>gi|4128016|emb|AJ011701.l|HSA011701 Homo sapiens TRHR gene promoter and exons 
1-2, partial 

Identities « 20/20 (100%) 

Query: 2 05 ctcctgctgctgcttctgct 224 

nniiinmniiini 

Sbjct: 1732 ctcctgctgctgcttctgct 1751 
exon 1691.. 194 6 
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>gi|l7985370|gb|AF284094.l|AF284094 Homo sapiens 13 binding protein (BRI3BP) 
mRNA, complete cds 
Identities = 22/23 (95%) 

Query: 205 ctcctgctgctgcttctgctgct 227 

iiimmiiiii iiiiiiM 

Sbjct: 130 ctcctgctgctgctgctgctgct 152 
CDS 88 . . 843 

>gi|l5625294|gb|AF286190.l|AF286190 Homo sapiens VPS10 domain protein mRNA, 
Identities = 22/23 (95%) 

Query: 205 ctcctgctgctgcttctgctgct 227 

lltlllllllllll IIIIIIM 

Sbjct: 5 ctcctgctgctgctgctgctgct 27 
CDS <!• ->1251 

>gi 1 28761 1 emb |X13629.1 1 HSAPOA4 Human intestinal mRNA for apo lipoprotein A- IV 
sntities = 22/23 (95%) 



: 205 ctcctgctgctgcttctgctgct 228 

1 iiiiimiimi iiiniii 

; 1203 ctcctgctgctgctcctgctgct 1181 
CDS 46.. 1236 



>gi|l745835l|ref|XM_047011.2| Homo sapiens protein O-fucosyl transferase 1 

(POFUT1) , mRNA 
Identities = 23/24 (95%) 

Query: 206 tcctgctgctgcttctgctgctcc 229 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mill 

Sbjct: 90 tcctgctgctgcttctgccgctcc 113 
CDS 50.. 1216 

>gi|l5812213|ref|NM_033431.l| Homo sapiens phosphodiesterase 5A, cGMP-specif 
(PDE5A) , transcript variant 4, mRSTA 
Identities = 20/20 (100%) 

Query: 2 08 ctgctgctgcttctgctgct 227 

" llll III I II I II I Mil II 

ct: 227 ctgctgctgcttctgctgct 208 
S 156.. 2753 



>gi | 3252778 |dbj|D89094.l| Homo sapiens mRNA for 3', 5 '-cyclic GMP 
phosphodiesterase , complete 
Identities =20/20 (10 0%) 

Query: 208 ctgctgctgcttctgctgct 227 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 3 91 ctgctgctgcttctgctgct 372 
CDS 320.. 2947 

>gi 1 11496985 | ref |NM_012072 . 2 | Homo sapiens complement component 1, q 
subcomponent, receptor 1 (C1QR1) / mRNA 
Identities - 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

lllilllllll IMIIIMIII 

Sbjct: 170 ctgctgctgctgctgctgctcct 192 
CDS 149.. 2107 



>gi|480928l|ref |NM_001718.2| Homo sapiens bone morpnogenetic protein 6 (BMP6) 
Identities = 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

iiiiiiiiiii iiiiiiiiiii 

Sbjct: 533 ctgctgctgctgctgctgctcct 511 

CDS 180.. 1721 

/note= n Vg-related sequence; transforming growth factor-beta" 

>gi | 14777259 | ref |XM027568.l| Homo sapiens similar to interleukin 9 receptor 
(LOC146316) , mRNA 
Identities = 22/23 (95%) 

Query: 208 ctgctgctgcttctgctgctcct 230 

iiiiiiiiiii iiiiiiiiiii 

Sbjct: 1294 ctgctgctgctgctgctgctcct 1272 
CDS 660. .1547 

|2626738|dbj|AB005060.l| Homo sapiens mRNA for NTAK, complete cds 
ities = 22/23 (95%) 




208 ctgctgctgcttctgctgctcct 2 30 

IIIIIIIIIII IIIIIIIIIII 

Sbjct: 341 ctgctgctgctgctgctgctcct 319 
CDS 226.-2778 

>gi| 4507106 |re£|NM_003086.l| Homo sapiens small nuclear RNA activating 
complex, polypeptide 4,9 OkDa (SNAPC4) , mRNA 
Identities = 21/22 (95%) 

Query: 208 ctgctgctgcttctgctgctcc 229 

iiiiiiiiiii miiiiiii 

Sbjct: 1994 ctgctgctgctgctgctgctcc 1973 
Identities = 27/29 (93%) , Gaps = 1/29 (3%) 

Query: 200 tcctcctc-ctgctgctgcttctgctgct 227 

I I I I I I I I IIIIIIIIIII. I I I M IN nQQ1 
Sbjct: 2009 tcctcctcgctgctgctgctgctgctgct 1981 

376. .4785 

21237798 | ref |NM_139205.1 | Homo sapiens histone deacetylase 5 (HDAC5) , 
^Janscript variant 2, 
Identities = 21/22 (95%) 

Query: 208 ctgctgctgcttctgctgctcc 229 

111 1 1 111 Mil II II I Mil 1D „ ' 

Sbjct: 1888 ctgctgctgcttctgcttctcc 1867 
Identities = 15/15 (100%) 

Query: 205 ctcctgctgctgctt 219 

illiilililiiili 

Sbjct: 670 ctcctgctgctgctt 656 

/noce="isoform 2 ifencoded by transcript variant 2; antigen NY-CO-9" 

>gi|2564750|gb|AF029308.l|HTCRBCHR9 Homo sapiens chromosome 9 duplication of 
the T cell receptor beta locus and trypsinogen gene families 
Identities = 19/19 (100%) 
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Query: 209 tgctgctgcttctgctgct 227 

lllllllll IIMIlllll 

Sbjct: 11391 tgctgctgcttctgctgct 11409 
V segment join (11390 .. 11420 

>gi|l296750|etnb|Z49234.l|HSTCRB2X2 H. sapiens gene for T-cell receptor TCRBV2.2 
Identities = 19/19 (100%) 

Query: 209 tgctgctgcttctgctgct 227 

liillilllllllllllli 

Sbjct: 976 tgctgctgcttctgctgct 994 
CDS 975..>1141 

>gi 1 13027808 | ref |NM_022718 . 1 1 Homo sapiens matrix metal loproteinase 25 
(MMP25), transcript variant 2, mRNA 
Identities = 18/18 (100%) 

Query: 210 gctgctgcttctgctgct 227 

I Mil 1 1 II I II I II II I 

: 264 gctgctgcttctgctgct 281 
238.. 1926 




12803104 |gb|BC002356.l|BC002356 Homo sapiens, nucleobindin 1, clone 
Identities » 21/22 (95%) 

Query: 213 gctgcttctgctgctcct 23 0 

mill iniiiiiiii 

Sbjct: 68 gctgctgctgctgctcct 85 
Query: 208 ctgctgctgcttctgctgctcc 229 

iiiiiniiiiii mum 

Sbjct: 1235 ctgctgctgcttccgctgctcc 1214 
CDS 27.. 1412 

>gi | 24496766 | ref |NM_004712 . 3 | Homo sapiens bepatocyte growth factor- regulated 
tyrosine kinase substrate (HGS) , mRNA 
Identities = 15/15 (100%) 

Query: 215 tgcttctgctgctcc 229 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ct: 1732 tgcttctgctgctcc .1718 
IDS 78. .2411 

£gi I 20544115 | ref | XM_059933 . 5 | Homo sapiens similar to putative 
lysophosphatidic acid acyltransf erase (LOC137SHS4) , mRNA 
Identities « 15/15 (100%) 

Query: 216 gcttctgctgctcct 23 0 

inn ii linn ii 

Sbjct: 2233 gcttctgctgctcct 2219 
CDS 913.. 2283 

>gi|22770666|gb|AF531299.l| Homo sapiens histone HI (HIST1H1A) gene, complete 
Identities = 15/15 (100%) 

Query: 216 gcttctgctgctcct 230 

MINI MINIMI 

Sbjct: 551 gcttctgctgctcct 565 
CDS 521.. 1168 
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> g ill8390058|gb|AF463518.l| Homo sapiens cell recognition protein CASPR4 
(CASPR4) mRNA, complete 
Identities = 15/15 (100%) 

Query: 216 gcttctgctgctcct 230 

miiiiiiiiim 

Sbjct: 1568 gcttctgctgctcct 1582 

CDS 140.. 4075 

/products "cell recognition protein CASPR4" 

>gi|21359973|ref|NM_053276.2| Homo sapiens vitrin (VIT) , mRNA 
Identities » 19/20 (95%) 

Query: 216 cttctgctgctcctaccacc 236 

^ lllllllllll llllllll 

Sbjct: 835 cttctgctgcttctaccacc 854 
CDS 222 ,.2303 

>gi|23308 6 02lref |KM_015460.1| Homo sapiens myosin VIIA and Rab interacting 

jptein (MYRIP) , mKNA 
pities = 15/15 (100%) 

220 ctgctgctcctacca 234 

II! 1 1 II I I I III 1 1 

Sbjct: 409 ctgctgctcctacca 423 

CDS 137.. 2716 , 

/product- "myosin VIIA and Rab interacting protein 

>gi|l555 9 HO|gblAF414087.l| Homo sapiens small breast epithelial mucin mRNA, 
complete cds 

Identities = 16/16 (100%) 
Query: 220 ctgctgctcctaccac 235 

iiiiiiiiniiiiii 

Sbjct: 210 ctgctgctcctaccac 225 
CDS 47.. 319 

note=«SBEM; secreted protein; similar to Mas musculus 

>gi|22779205|dbj|AB083783.l| Homo sapiens slac2-c mRNA for Sip homologue 
lacking C2 domains-c, complete cds 
^entities = 15/15 (100%) 

rv- 220 ctgctgctcctacca 234 

r I II I I III II II I li 

Sbjct: 273 ctgctgctcctacca 287 
CDS 1..2580 

>gi|7705267|ref lNM_016255.ll Homo sapiens family with sequence similarity 8, 
member Al (FAM8A1) , 
Identities = 15/15 (100%) 

Query: 226 ctcctaccaccgccg 240 

illlliiiliniii 

Sbjct: 147 ctcctaccaccgccg 161 
CDS 56.. 1297- 

/product= "Autosomal Highly Conserved Protexn 

>gi | 14210509 | ref | NM_032496 . 1 | Homo sapiens rho-gtpase activating protein 
ARHGAP9 (ARHGAP9) , mRNA 
Identities = 15/15 (100%) 





Query: 240 gcctctggtgccacc 254 

muni in i in 

Sbjct: 2335 gcctctggtgccacc 2349 

CDS 407.. 2659 

/product=" hypothetical protein MGC12959" 

>gi|l84756|gb|J00221.l|HUMIGCD7 Human Ig germline H-chain G-E-A region B: 
alpha-2 A2m(l) allele constant region, 3' end 
Identities = 15/15 (100%) 

Query: 240 gcctctggtgccacc 254 

I i II u Hi I II 1 1 i 

Sbjct: 800 gcctctggtgccacc 814 

C DS join(<164. .469, 684.. 1004, 1227. .1621) 

/product=" immunoglobulin alpha- 2 heavy chain" 

>gi (21361375 |ref|NM_007165. 2 | Homo sapiens splicing factor 3a, subunit 2, 
66kDa (SF3A2) , mRNA 
Identities = 16/16 (100%) 

: 248 tgccaccgcccccgcc 263 

III! Ill I 111 I II I! 

: 876 tgccaccgcccccgcc 891 
— £bs 12 5.. 15 19 

/note="Spliceosome protein SAP-62; splicing factor 3a, 
subunit 2, 66kD" 

>gi 121361291 1 ref |HM_005611.2 | Homo sapiens retinoblastoma -like 2 (p!30) 
(RBL2) , mRNA 

Identities = 15/15 (100%) 
Query: 249 gccaccgcccccgcc 263 

Ml I II I II Ml IN 

Sbjct: 93 gccaccgcccccgcc 10 7 
CDS 70.. 3489 

>gi | 4505322 | ref |NM_003941.l| Homo sapiens Wiskott-Aldrich syndrome-like 
(WASL) , mRNA 

Identities = 15/15 (100%) 

ery: 249 gccaccgcccccgcc 263 

; iimmmmi 

ct: 1406 gccaccgcccccgcc 1420 
^CDS 255.. 1772 

>gi|5901937|ref lMM_007021.il Homo sapiens decidual protein induced by 
progesterone (DEPP) , mRNA 
Identities = 15/15 (100%) 

Query: 249 gccaccgcccccgcc 263 

llllll MM III I 

Sbjct: 7 87 gccaccgcccccgcc 801 
CDS 219.. 857 

>gi | 22045278 1 ref | XM_001334 . 5 | Homo sapiens POXJ domain, class 3, transcription 
factor 1 (P0TJ3F1) , 
Identities » 16/16 (100%) 

Query: 250 ccaccgcccccgccgg 265 

llllllllllllllll 

Sbjct: 1326 ccaccgcccccgccgg 1341 
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/product=«similar to* OctaLr-binding transcription factor 6 (OCT-6) (POU-domain 
transcription factor SCIP) (TST-1) " 

>gi | 24234749 | ref |NM_012218 . 2 | Homo sapiens interleukin enhancer binding factor 
3, 90kDa (ILF3) , transcript variant 1, mRNA 
Identities = 15/15 (100%) 

Query: 250 ccaccgcccccgccg 264 

iiiiiiiiiiiiiii 

Sbjct: 2389 ccaccgcccccgccg 2375 

/note="isoform a "'encoded by transcript variant 1; double- stranded J^^f 
nrotein 76 kD; M-phase phosphoprotein 4; nuclear factor associated with dsRHA, 
nucSar'flctor of activated T-cells, 90 kD; translational control protein 80 

>gi|l90749|gb|M96684.l|HDMPDRA H . sapiens Pur (pur-alpha) mRNA, complete cds 
Identities = 16/16 (100%) 




: 250 ccaccgcccccgccgg 265 

him nun urn 

: 163 ccaccgcccccgccgg 148 

60. .1028 • ■ 

/fxinction=«sequence-specific single- stranded DNA bxndxng protexn 

>gi | 4885128 | ref | NM_005194 . 1 [ Homo sapiens CCAAT/enhancer binding protein 
(C/EBP) , beta (CEBPB) , 
Identities = 15/15 (100%) 

Query: 250 ccaccgcccccgccg 264 

iiiiiiiiiiiiiii 

Sbjct: 484 ccaccgcccccgccg 498 
CDS 1..1038 

>gi 1 24850134 1 ref lKM_170695.il Homo sapiens TGFB-induced factor (TALE family 
homeobox) (TGIF) , 
Identities = 18/19 (94%) 

Query: 253 ccgcccccgccggtgcccg 271 

" iiiiiiiiiini iiiii 

ct: 374 ccgcccccgccggagcccg 356 
fcDS 304.. 1509 

Tgil20805946lgblAY083269.il Homo sapiens transcription factor mammalian MafA 
gene , complete cds 
Identities = 18/19 (94%) 

Query: 253 ccgcccccgccggtgcccg 271 

iiiii iiiiiiiiiini _ 

Sbjct: 236 ccgccgccgccggtgcccg 218 

CDS 1..1059 
>gi|5058992|gb|U66095.l|U66095 Homo sapiens cell-line THP-1 GTP cyclobydrolase 

I mRNA, complete 
Identities = 15/15 (100%) 

Query: 257 ccccgccggtgcccg 271 

iiiiiiiiiiiiiii 

Sbjct: 177 ccccgccggtgcccg 163 
CDS 1^5. . 846 
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>gi|4507750|ref |NM_001071 . 1 | Homo sapiens thymidylate synthetase (TYMS) , mRNA 
Identities = 15/15 (100%) 

Query: 261 gccggtgcccgtgcg 275 

1 1 i it I II M 1- 1 i it 

Sbjct: 267 gccggtgcccgtgcg 253 
CDS 106.. 1047 

>gi[l7511946|gb|BC018929.l|BC018929 Homo sapiens, Similar to T-cell death 
associated gene, clone 
Identities = 15/15 (100%) 

Query: 261 gccggtgcccgtgcg 275 

lliliillliiilll 

Sbjct:. 1029 gccggtgcccgtgcg 1015 
CDS 279.. 1058 

>gi|6679302|ref | NM_007350 . 1 1 Homo sapiens pleckstrin homology- like domain, 
ly A, member l(PHLDAl), mRNA 
ities = 15/15 (100%) 





: 261 gccggtgcccgtgcg 275 

1 1 1 III Ml Ml III 

Sbjct: 1333 gccggtgcccgtgcg 1319 
CDS 160. .1362 

>gi|23097243 | ref |NM_152891. 1 | Homo sapiens serine protease EOS (EOS), mRNA 
Identities « 19/20 (95%) 

Query: 263 cggtgcccgtgcgaccggtg 282 

lllllllllllllll MM 

Sbjct: 385 cggtgcccgtgcgacgggtg 404 
CDS 69.. 923 

>gi | 20555609 | ref |XM_165720 . 1 | Homo sapiens HCR (a-helix coiled-coil rod 
homologue) (HCR) , mRNA 
Identities = 15/15 (100%) 

Query: 275 gaccggtggtggtag 289 

MMMMMMMI 

jet: 1573 gaccggtggtggtag 1559 
S 80.. 2428 



>gi 1 10947055 | ref |NM_020987 . 1 1 Homo sapiens ankyrin 3, node of Ranvier (ankyrin 
G) (ANK3), transcript variant 1, mRNA 
Identities «= 21/21 (100%) 

Query: 280 gtggtggtagtggtggtggtg -300 

MMMMIMMMMMM 

Sbjct: 12113 gtggtggtagtggtggtggtg 12093 
Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

MMMM MMMMMMI 

Sbjct: 12096 ggtggtggcagtggtggtggtg 12075 

Identities = 18/18 (100%) 

Query: 279 ggtggtggtagtggtggt 296 
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IMIIIMM II 1 1 1 1 1 1 

Sbjct: 12123 ggtggtggtagtggtggt 12106 
Identities = 20/22 (90%) 

Query: 27 9 ggtggtggtagtggtggtggtg 300 

llllll II IIIIIIIIMII 
Sbjct: 12111 ggtggtagtggtggtggtggtg 12090 

Identities = 19/21 (90%) 

Query: 279 ggtggtggtagtggtggtggt 299 

IIIMIIII II MINIM 

Sbjct: 12126 ggtggtggtggtagtggtggt 12106 
Identities « 13/13 (100%) 

27 9 ggtggtggtagtg 291 

Illllllllllll 
12081 ggtggtggtagtg 12 069 
193.. 13326 

>gi| 7662227 |ref|NM_014841.l| Homo sapiens synaptosomal -associated protein, 
91kDa homolog (mouse) (SNAP91) , mRNA 
Identities = 20/20 (100%) 

Query: 279 ggtggtggtagtggtggtgg 298 

lllllllillllllllllll 
Sbjct: 18 90 ggtggtggtagtggtggtgg 1871 
CDS 244.. 2967 

Identities = 14/14 (10 0%) 

Query: 279 ggtggtggtagtgg 292 

MMMIIMI III 

Sbjct: 717 ggtggtggtagtgg 704 
tities = 19/21 (90%) 




Query: 279 ggtggtggtagtggtggtggt 2 99 

llllll II I Ml MM Ml 

Sbjct: 729 ggtggtagtggtggtggtggt 7 09 
CDS 320.. 1168 

>gi|5453935|ref | NM_006236 . 1 1 Homo sapiens POU domain, class 3, transcription 
factor 3 (POU3F3) , 
Identities = 21/22 (95%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

1 1 1 1 1 ! 1 1 1 MIMIMMM 

Sbjct: 829 ggtggtggtggtggtggtggtg 808 
CDS 1..1503 

>gi | 21396478 | ref |NM_005924.2 | Homo sapiens mesenchyme homeo box 2 (growth 
arrest- specif ic homeo box) (MEOX2) , mRNA 
Identities - 21/22 (95%) 
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Query: 279 ggtggtggtagtggtggtggtg 30 0 

iiiiiini illinium 

Sbjct: 404 ggtggtggtggtggtggtggtg 383 
Identities = 21/22 (95%) 

Query: 27 9 ggtggtggtagtggtggtggtg 300 

III II HI I I I I I I I I I I I I I 
Sbjct: 407 ggtggtggtggtggtggtggtg 386 

Identities = - 20/22 (90%) 

Query: 279 ggtggtggtagtggtggtggtg 300 

mini i miiiiimi 

Sbjct: 416 ggtggtgatggtggtggtggtg 395 
CDS 182.. 1093 

>gi | 21361336 | ref | NM_001969 . 2 | Homo sapiens eukaryotic translation initiation 
factor 5 (EIF5) , mKNA 



pities ■ 21/22 (95%) 





279 ggtggtggtagtggtggtggtg 300 

iiiiimi imiiimn 

Sbjct: 1022 ggtggtggtggtggtggtggtg 1001 
Identities = 19/20 (95%) 



Query: 2 81 tggtggtagtggtggtggtg 3 00 

mm mi i mum i nA 

Sbjct: 1023 tggtggtggtggtggtggtg 1004 
CDS 469.. 1764 

>gi|l2597624 | ref 1^012068.2) Homo sapiens activating transcription factor 5 
(ATF5) , mRNA 

Identities = 20/20 (100%) 

•ry: 281 tggtggtagtggtggtggtg 30 0 

, IIIIIIIIIIIIIIIIMII 

)jct: 730 tggtggtagtggtggtggtg 711 
>gi|201274 9 4|ref|NM_00 62 37.2| Homo sapiens POU domain, class 4, transcription 

factor 1 (P0D4F1) , 
Identities = 21/22 (95%) 

Sbjct: 553 ggtggtggtggtggtggtggtg 532 
Identities = 21/22 (95%) 

Query:' 279 ggtggtggtagtggtggtggtg 300 

111 I I 1 I I I 1 I I I I I I 1 1 I 1 I „ B - 
Sbjct: 556 ggtggtggtggtggtggtggtg 535 

Identities « 19/20 (95%) 
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Query: 281 tggtggtagtggtggtggtg 30 0 

mini illinium 

Sbjct: 560 tggtggtggtggtggtggtg 541 

CDS 235.. 1497 ^ pmi ^ 

>gi|20379115|gb|AF498971.l| Homo sapiens small GTP binding protein RhoB (ARHB) 

mRNA, complete 
Identities = 15/15 (100%) 

Query: 2 99 tggtggtggtgggcg 313 

II MINI II I MM 

Sbjct: 23 tggtggtggtgggcg 37 
CDS 1.-591 

>gi| 190939 |gb|M38453.l|HDMRASTG Human ras transforming protein gene, exon 1 
Identities = 15/15 (100%) 

Query: 299 tggtggtggtgggcg 313 

MMMMMMIM 

Sbjct: 149 tggtggtggtgggcg 163 
~ :on 133 ..243 

^0544140 I ref |NM_003185 . 2 | Homo sapiens TAF4 RNA polymerase II, TATA box 
■ng protein(TBP) -associated factor, 135kDa (TAF4) , mRNA 
Stities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

MIMMMIMM 

Sbjct: 125 tggtggtggtgggc 112 
CDS 1..3252 

>gi|21361B62|ref lNM_033104.2| Homo sapiens stonin 2 (STN2) , mRNA 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 2110 tggtggtggtgggc 2097 

, ,-, 202 2919 

>gi|22597105|gb|AF52i671.l| Homo sapiens SWl/SNF chromatin remodeling complex 

subunit OSA2 

[entities = 14/14 (100%) 

try: 299 tggtggtggtgggc 312 

M II I I M II I M I 
Sbjct: 68 tggtggtggtgggc 55 
CDS <1- .6498 

>gi | 22051956 lref |XM_113S25.2| Homo sapiens similar to Antrax toxin receptor 
precursor (Tumor endothelial marker 8) (LOC195977) , mRNA 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

llllllllllllll 
Sbjct: 411 tggtggtggtgggc 398 
CDS 251.. 1171 

>gi|l7863992|gb|AF449430.l|AF449430 Homo sapiens endocytosis protein HSTNB 
variant mRNA, complete cds 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 
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MINIMI Mill 

Sbjct: 2110 tggtggtggtgggc 2097 

CDS 202. .2919 

>gi 1 11065969 | gb | AF193855 . 1 1 AF193855 
cerebellum ZIC2 (ZIC2) mRNA, 
Identities = 14/14 (100%) 

Query: 299 tggtggtggtgggc 312 

1 1 1 1 1 1 M 1 1 1 1 1 1 

Sbjct: 701 tggtggtggtgggc 688 
CDS 1..1599 



Homo sapiens zinc finger protein of 



Homo sapiens similar to MDM2 variant FB29 




Homo sapiens phosphoglucomutase 1 (PGM1) , mRNA 




>gi 1 17474021 1 ref | XM_058523 . 1 1 
(LOC121015) , mRNA 
Identities » 14/14 (100%) 

Query: 302 tggtggtgggcggg 315 

MMMMMMM 

Sbjct: 117 tggtggtgggcggg 104 
^ CDS 26.. 418 

361620 | ref |NM_002633 . 2 | 
'ities = 14/14 (100%) 

Query: 302 tggtggtgggcggg 315 

1 1 1 1 1 1 1 1 1 1 M M 

Sbjct: 383 tggtggtgggcggg 396 
CDS 214.. 1902 

>gi|6979929|gb|AF221759.l|AF221759 
Identities = 14/14 (100%) 

Query: 303 ggtggtgggcgggt 316 

MIMMMIMM 

Sbjct: 1643 ggtggtgggcgggt 163 0 
CDS <1. -2682 

>gi 1 4505736 | ref | NM_002621 . 1 1 Homo sapiens properdin P factor, complement 
(PFC) , mRNA 

.entities = 14/14 (100%) 

fery: 306 ggtgggcgggtact 320 

M III II III MM 

Sbjct: 1493 ggtgggcgggtact 1480 
CDS 243.. 1652 



Homo sapiens Maml mRNA, partial cds 



>gi | 20127484 | ref |NM_005654 . 2 | 
F, member 1 (NR2F1) , mRNA 
Identities = 14/14 (100%) 



Homo sapiens nuclear receptor subfamily 2, group 



Query: 319 tagcgcgacgtggg 332 

III I MM I Mill 

Sbjct: 705 tagcgcgacgtggg 692 

/nSe= "Transcription 'factor COUP 1 (chicken ovalbumin upstream promoter 1, ; 
transcription factor COUP 1 » 

>gi 1 16418382 | ref | NM_052876 . 1 1 Homo sapiens transcriptional repressor NAC1 
(NAC1) , mRNA 

Identities = 15/15 (100%) 
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Query: 326 acgtgggcgaccagt 340 

1 1 Mill I lllllll 

Sbjct: 404 acgtgggcgaccagt 418 

CDS 127.. 1710 

/note= B contains POZ domain" 

>gi| 16445431 |ref|NM_033662.l| Homo sapiens WD repeat domain 4 (WDR4) , 
transcript variant 3 f mRNA 
Identities = 16/16 (100%) 

Query: 328 gtgggcgaccagtggc 343 

I I lllllll lllllll 
Sbjct: 882 gtgggcgaccagtggc 897 

CDS 363.. 1163 . , 

/note="isoform 2 is encoded by transcript variant 3; WD repeat - contaxnxng 

protein 4" 

>gi|22027497|ref|NM_012295.2| Homo sapiens calcineurin binding protein 1 
INI) , mRNA 
;ities « 15/15 (100%) 




: 334 gaccagtggctgctg 348 
Mill I I I II 1 I I I I 
Sbjct: 1787 gaccagtggctgctg 1801 
CDS 128.. 6790 

>gi|20336259|ref|NM_015866.2| Homo sapiens PR domain containing 2, with ZNF 
domain (PRDM2) , transcript variant 2, mRNA 
Identities = 14/14 (100%) 

Query: 336 ccagtggctgctgg 349 

MMMIMMMI 

Sbjct: 3329 ccagtggctgctgg 3316 

/SSe--isoform b if encoded by transcript variant 2; zinc-finger ^"^^ 
protein; retinoblastoma protein- interacting zinc finger protein; MTE-bxndxng 
protein" 

>gi| 22042322 |ref|XM_015428. 3 | Homo sapiens similar to CGI-105 protein 
•C151313), mRNA 



■ ■Kler 



.titles = 14/14 (100%) 



Lery: 337 cagtggctgctggg 350 

I I 1 I 1 1 1 I I 1 1 1 1 1 
Sbjct: 620 cagtggctgctggg 633 
CDS 11.. 955 

>gi| 20270612 |ref|NG_001318.l| Homo sapiens HSP40 pseudogene (HSP40) 
Identities = 14/14 (100%) 

Query: 337 cagtggctgctggg 350 

I MINI II Mill 

Sbjct: 2499 cagtggctgctggg 2486 
mi sc_f eature 1 . . 2 8 8 2 

>gi I 21265045 |ref|NM_139027.l| Homo sapiens a disintegrin- like and 
metalloprotease (reprolysin type) with thrombospondm type 1 motif, 13 
(ADAMTS13) , transcript variant 2, mRNA 
Identities = 17/17 (100%) 
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Query: 339 gtggctgctgggctggg 355 

mm; i minimi 

Sbjct: 3812 gtggctgctgggctggg 3828 

CDS 445.. 4560 ( 

(vWF) -cleaving protease, which is responsible for cleaving at the 

> g i| 22050832 |ref|XM_114863. 2 1 Homo sapiens similar to alpha 2 type IV collagen 
preproprotein;canstatin (LOC203630) , mRNA 
Identities = 16/16 (100%) 

Query: 339 gtggctgctgggctgg 354 

IIIIMIIMMMII 

Sbjct: 450 gtggctgctgggctgg 465 

CDS 1- .1425 , . . . _ 

/products similar to alpha 2 type IV collagen preproprotein ; canstatm 

>gi|22064435|reflXM_017037.3| Homo sapiens suppressor of Ty 6 homolog (S. 
cerevisiae) (SUPT6H) , 
identities = 15/15 (100%) 

: 340 tggctgctgggctgg 354 

II III 1 1 1 1 Mil 1 1 

: 4624 tggctgctgggctgg 4610 
S 161.. 4972 

>gi|20149786|gb|AF039196.3| Homo sapiens putative single zinc finger 
transcription factor protein (hairless) mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 341 ggctgctgggctggg 355 

MM 1 1 1 1 MM 11 1 

Sbjct: 4218 ggctgctgggctggg 4204 

CDS 1485. .5054 

/note=« restricted expression in the brain and slcm" 

>gi | 20070162 |ref]NM_018896. 2 | Homo sapiens calcium channel, voltage -dependent, 
alpha 1G subunit (CACNA1G) , mRNA 
Identities = 15/15 (100%) 

Query: 342 gctgctgggctgggt 356 

mi minimi 

ct: 1440 gctgctgggctgggt 1426 
CDS 1..7134 

>gi 1 18564486 | ref j XM_094865 . 1 1 Homo sapiens similar to Olfactory receptor 4F3 
(L.OC168119) , mRNA 
Identities = 15/15 (100%) 

Query: 343 ctgctgggctgggtt 357 

MMMMMMIII 

Sbjct: 49 ctgctgggctgggtt 35 
CDS 1..978 

>gi 1 4503532 1 ref 1^001417.11 Homo sapiens eukaryotic translation initiation 
factor 4B (EIF4B) , 
Identities = 16/16 (100%) 

Query: 350 gctgggttcacgtggt 3 65 

IMMMMMIMII 

Sbjct: 393 gctgggttcacgtggt 378 
CDS 1..1836 
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>gi| 4557252 | ref |NM_001109 . 1 | Homo sapiens a disintegrin and metal loproteinase 
domain 8 (ADAM8) , 
Identities = 15/15 (100%) 

Query: 360 cgtggtggtggttct 374 

Mill Mllllllli 

Sbjct: 1980 cgtggtggtggttct 1994 
CDS 1° • .2484 

>gi|2014392l|ref|NM133437.l| Homo sapiens titin (TTN) , transcript variant 
novex-2, mRNA 
Identities = 17/18 (94%) 

Query: 360 cgtggtggtggttct cca 377 

1111 lllllllllllll 

Sbjct: 33611 cgtgatggtggttctcca 33628 

CDS 224.. 81580 . ^ 

/note="isoform novex-2 is encoded by transcript variant novex-2; connects, 

9, included" 




PMGC: 36749 
Rtities = 14/14 (100%) 



726242 |gb|BC037404.l| Homo sapiens, Similar to formin binding protein 4, 



Query: 361 gtggtggtggttct 374 

iiiiiniimii 

Sbjct: 2743 gtggtggtggttct 2730 
CDS 28.. 3075 

>gi 1 4557234 | ref |NM 000018. l| Homo sapiens acyl-Coenzyme A dehydrogenase, very 
long chain UcaDVlT, nuclear gene encoding mitochondrxal protein, mRNA 
Identities = 14/14 (100%) 

Query: 362 tggtggtggttctc 3 75 

lllllllll Mill 

Sbjct: 1818 tggtggtggttctc 1831 
CDS 86 . .2053 

>gi | 22048275 | ref j XM_063346 . 3 | Homo sapiens similar to polypyrimidine- tract 
.nding protein (LOC122888 ) , mRNA 
tities = 14/14 (100%) 



1 ^fM: n d 



tery: 363 ggtggtggttctcc 376 

i it ii i mi mi i 

Sbjct: 1345 ggtggtggttctcc 1332 
CDS 1..1461 

>gi | 4885524) ref |NM_005490.l| Homo sapiens SH2 domain containing 3A (SH2D3A) , 
Identities « 15/15 (100%) 

Query: 390 ctgcgcgctcctcca 414 

iiiiiiiiiiiiin 

Sbjct: 1319 ctgcgcgctcctcca 1305 
CDS 152.. 1882 

>gi|2206084l|ref | XM_165659 . 2 | Homo sapiens elaC homolog 1 (B. coli) (ELAC1) , 
mRNA 

Identities = 16/16 (100%) 
Query: 397 ctcctccatcacccac 412 
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miiiiiiiiiiiii 

Sbjct: 894 ctcctccatcacccac 879 

CDS 108. .1199 

/product=« similar to elaC homolog 1 (E. coli); similar to Escherichia colx elaC; 
hypothetical protein D29; elaC 



>gi|9055315|ref |NM_012406 . 2 | Homo sapiens PR domain containing 4 (PRDM4) , mRNA 
Identities = 15/15 (100%) 

Query: 397 ctcctccatcaccca 411 

MIIIIIIIIIIIII 

Sbjct: 1109 ctcctccatcaccca 1123 
CDS 123.. 2528 

>gi | 22046620 | ref | XM_069728 . 3 | Homo sapiens similar to beta- glucuronidase 
(LOC13 6132) , mRNA 

tntities = 15/15 (100%) 



^ Itenti 

: 




399 tcctccatcacccac 413 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ft: 663 tcctccatcacccac 64 9 
CDS 1. .972 

>gi j 19263734 | gb| BC025358 . 1 1 Homo sapiens, ATP-binding cassette, sub-family D 
(ALD) , member 1, 
Identities = 15/15 (100%) 

Query: 400 ctccatcacccaccg 414 

lllllllllllllll 

Sbjct: 2364 ctccatcacccaccg 2378 
CDS 400.. 2637 

>gi|H968022 | ref |NM_022473 . 1 | Homo sapiens zinc finger protein 106 (ZPP106) , 
mRNA • 

Identities = 15/15 (100%) 
Query: 4 00 ctccatcacccaccg 414 

lllllllllllllll 

ct: 3838 ctccatcacccaccg 3852 
IS 336.. 5987 

18586624 | ref | XM_085530 . 1 | Homo sapiens similar to Adrenoleukodys trophy 

protein (ALDP) 
Identities = 15/15 (100%) 

Query: 400 ctccatcacccaccg 414 

lllllllllllllll 

Sbjct: 310 ctccatcacccaccg 324 
CDS 134.. 583 

misc_£eature 161. .376 

>gi 1 19743876 | ref |NM_002918 . 2 | Homo sapiens regulatory factor X, 1 (influences 
HLA class II expression) (RFX1) , mRNA 
Identities = 15/15 (100%) 

Query: 406 cacccaccgctgctg 420 

lllllllllllllll 

Sbjct: 220 cacccaccgctgctg 234 
CDS 93.. 3 032 
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>gi| 19263734 | gb | BC025358 . 1 1 Homo sapiens, ATP-binding cassette, sub-family D 
(ALD) , member 1, 
Identities = 15/15 (100%) 
Query: 410 ctccatcacccaccg 424 

llllllllliiini 

Sbjct: 2364 ctccatcacccaccg 2378 

CDS 400.. 2637 

i 

>gi 1 18586624 | ref | XM_085530 . 1 1 Homo sapiens similar to Adreno leukodystrophy 
protein (ALDP) (LOC146640) , mRNA 
Identities = 15/15 (100%) 

Query: 410 ctccatcacccaccg 424 

llilllililllill 

Sbjct: 310 ctccatcacccaccg 324 
CDS 134.. 583 

|11968022 |ref | NM_022473 . 1 1 Homo sapiens zinc finger protein 106 (ZFP106) , 

ities = 15/15 (100%) 

ery: 410 ctccatcacccaccg 424 

llilllililllill 

Sbjct: 3838 ctccatcacccaccg 3852 
CDS 336.-5987 

>gi| 13184045 | ref | NM_023944 . 1 1 Homo sapiens cytochrome P450, subfamily IVF, 
polypeptide 12 (CYP4F12) , mRNA 
Identities = 17/17 (100%) 

Query: 413 cgctgctgagcctgccc 429 

iiiiiii iiiiiiii 1 1 

Sbjct: 35 cgctgctgagcctgccc 51 
CDS 31.. 1605 

>gi|23821028 | ref | NMJL53486 . 1 1 Homo sapiens lactate dehydrogenase D (LDHD) , 
mRNA 

Identities =20/22 (90%) 

ry: 424 ctgcccgacgcgcggctcctgc 445 

MINIMI, 1 1 1 1 1 1 Mil 

jet: 637 ctgcccgacgggcggctgctgc 658 
CDS 58. .1518 

>gi | 24528580 |gb|AF07 952 9. 2 | Homo sapiens cAMP- specif ic phosphodiesterase 8B1 
(PDE8B) mRNA, complete cds; alternatively spliced 
Identities = 15/15 (100%) • . 

Query: 427 cccgacgcgcggctc 441 

llilllililllill 

Sbjct: 224 cccgacgcgcggctc 210 
CDS 46.'. 2703 

>gi | 22001416 | ref | NM_015465 . 1 1 Homo sapiens gemin 5 (GEMIN5) , mRNA 
SMN complex component; Sm- interacting protein; DKFZP58 6M1824 protein 
Identities =' 14/14 (100%) 

Query: 434 cgcggctcctgccc 447 

iiiiiiiiiiiin 





Sbjct: 17 cgcggctcctgccc 4 
CDS 1..4527 

>gi| 29459 |emb|X68149.l|HSBLRlA Homo sapiens BLR1 gene for Burkitt 1 s lymphoma 
receptor 1 

Identities = 18/19 (94%) 

Query: 434 cgcggctcctgcccaagct 452 

illllllllll iiiiiii 

Sbjct: 1085 cgcggctcctgaccaagct 1103 
CDS 85.. 1203 

>gi| 84 0783 |emb|X68829.l|HSMDCR H. sapiens mRNA for MDR15 protein 
Identities = 18/19 (94%) 

Query: 434 cgcggctcctgcccaagct 452 

Illllllllll IIIIIII 

Sbjct: 1154 cgcggctcctgaccaagct 1172 
CDS 289.. 1272 

1032094 |ref | NMJD0563 0 . 1 1 Homo sapiens solute carrier family 21 
taglandin transporter) , member 2 (SLC21A2) , mRNA 
Identities = 17/17 (100%) 

Query: 437 ggctcctgcccaagctc 453 

III MINI 111 Mill 

Sbjct: 88 ggctcctgcccaagctc 104 

CDS 84.. 2015 

>gi| 4505876 |ref |NM_000445 . 1 | Homo sapiens plectin 1/ intermediate filament 
binding protein 500kDa (PIiECl) , mRNA 
Identities = 17/18 (94%) 

Query: 438 gctcctgcccaagctcct 455 

MINIM MINIMI 

Sbjct: 7156 gctcctgcgcaagctcct 7139 

CDS 52.. 13776 

/functions "high molecular weight cytoskeletal-associated protein which is a 
component of hemidesmosomes in basal keratinocytes and also a component of the 
sarco lemma in muscle (HD1) 

22058106 J ref |XM_171754.1 1 Homo sapiens similar to a disintegrin-like and 
alloprotease (reprolysin type) with thrombospondin type 1 motif, 17 
Sreproprotein (LOC257018) , mRNA 
dentities = 15/15 (100%) 

Query: 438 gctcctgcccaagct 452 

MMMIIIIIMM 

Sbjct: 91 gctcctgcccaagct 77 
CDS 1..42 0 

>gi|4505936|ref |NM_002693 . 1 1 Homo sapiens polymerase (DNA directed), gamma 
(POLG) , nuclear gene encoding mitochondrial protein, mRNA 
Identities = 14/14 (100%) 

Query: 438 gctcctgcccaagc 451 

iiiiiiiiiiiiii 

Sbjct: 1953 gctcctgcccaagc 1966 
CDS 283.. 4002 
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>gi|53 3527|gb|U10694.l|HSU10694 Human MAGE -9 antigen (MAGB9) gene, complete 
cds 

Identities = 18/19 (94%) 

Query: 438 gctcctgcccaagctcctg 456 

iilililllll iiiiiii 

Sbjct: 1290 gctcctgcccacgctcctg 1308 
exon 1268 . . >2B45 

CDS 1333.. 2280 

>gi | 4758361) ref |NM_004112.l| Homo sapiens fibroblast growth factor 11 (PGF11) , 
tnRNA 

Identities = 16/16 (100%) 
Query: 442 ctgcccaagctcctgg 457 

MM I MM 1 1 ! Mil 

Sbjct: 589 ctgcccaagctcctgg 604 
CDS 1. . 678 

13435128|ref | NM_022089 . 1 j Homo sapiens putative ATPase (HSA9947) , mKNA 
ities « 17/18 (94%) 




442 ctgcccaagctcctggtc 459 

M 1 1 1 1 1 1 ! IMMMI 

Sbjct: 2555 ctgcccaaggtcctggtc 2572 
CDS 35.. 3577 

>gi|24308028 | ref | NM_015296 . 1 | Homo sapiens ziziminl (ziziminl) , tnRNA 
Identities = 14/14 (100%) 

Query: 445 cccaagctcctggt 458 

MMMMMMM 

Sbjct: 2431 cccaagctcctggt 2418 

CDS 56..626S 
note= n Cdc42 activator" 

>gi | 22043940 | ref | XM_060678 . 5 | Homo sapiens similar to Synaptotagmin II (Sytll) 
(LOC127833) , mRNA 
Identities = 14/14 (100%) 



ft 



ery: 445 cccaagctcctggt 458 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ct: 540 cccaagctcctggt 527 
CDS 1..1278 



>gi | 18599586 | ref | XM_092362 . 1 | Homo sapiens similar to 
evidence :NAS -hypothetical protein-putative (LOC1650 86) , tnRNA 
Identities = 17/18 (94%) 

Query: 448 aagctcctggtctaggag 465 

! 1 1 1 1 1 1 1 1 1 1 1 1 Mil 

Sbjct: 776 aagctcctggtctgggag 759 
CDS 1..936 

>gi|23336903|tpg|BK000566.l| TPA: Homo sapiens SF3bl25 DEAD -box protein mRNA, 

complete cds, 

Identities » 14/14 (100%) 

Query: 452 tcctggtctaggag 4 65 

MMMMMMM 

Sbjct: 399 tcctggtctaggag 386 
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CDS 



1- .2460 



>gi [22052707 | ref |XM_172523.1 1 
receptor (LOC256135) , mRNA 
Identities = 14/14 (100%) 

Query: 460 taggagtaaggcca 473 

i 1 1 1 1 1 M ll M 1 1 

Sbjct: 410 taggagtaaggcca 3 97 
CDS 81.. 560 

>gi 1 474428 | emb | Z3 1702 . 1 1 HSP53DN 
Identities = 16/16 (100%) 



Homo sapiens similar to N-formyl peptide 



H . sapiens p5-3 DNA 



Query: 461 aggagtaaggccatgg 476 

1 1 II! ! II MM II 

Sbjct: 264 aggagtaaggccatgg 279 
1. .1464 

Non-homologous recombination within the major histocompatibility 
complex creates a transcribed hybrid sequence 



Icfenti 



550199 I ref |XM_059368 . 2 | Homo sapiens similar to thymidilate kinase 
r y LPS -inducible member; thymidylate kinase homologue (LOC129607) , mRNA 
tities = 14/14 (100%) 

Query: 467 aaggccatgggcgc 480 

II 1 1 1 M 1 1 1 1! I ! 

Sbjct: 23 aaggccatgggcgc 10 
CDS 16.. 1365 

>gi|6706902|emb|AL109827.8|HSJ309K20 Human DNA sequence from clone RP1-309K20 
on chromosome 20 Contains the gene for a novel protein similar to dysferlin, the 
SPAG4 gene for sperm associated antigen 4, the CPNE1 gene for Copine I (similar 
to KIAA0636) , the gene KIAA0765 (HRIHFB2091) for an RNA recognition motif 
(RNP, RRM or RBD domain) containing protein and the 3' end of the NIFS 
gene for cysteine desulfurase. 
Identities = 16/16 (100%) 



Query: 468 aggccatgggcgcggc 48 3 

lllllllllll I MM 

7506 aggccatgggcgcggc 7491 
7357. .7540 



j ct : 



i | 21614532 | ref | NM_144957 . 1 | Homo sapiens protease, serine, 21 (testisin) 
PRSS21) , transcript variant 3, mRNA 
Identities = 14/14 (100%) 

Query: 468 aggccatgggcgcg 481 

1 1 1 f 1 1 1 1 1 1 1 1 1 1 

Sbjct: 102 aggccatgggcgcg 115 
CDS 107. .1009 

>gi|l8087852 | ref |NM_080672 . 1 1 Homo sapiens Q9H4T4 like (H17739) , mRNA 
Identities = 18/19 (94%) 

Query: 4 69 ggccatgggcgcggccggc 487 

niimiii iiiiiiii 

Sbjct: 141 ggccatgggcccggccggc 123 
CDS 136. .1815 
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>gi|790818|gb|L39891.l|HUMPKDlGEN Homo sapiens polycystic kidney disease 
associated protein (PKD1) gene, 
Identities = 16/16 (100%) 



Query: 475 gggcgcggccggccgc 490 

iiiiiiiiiiiiiiii 

Sbjct: 50097 gggcgcggccggccgc 50082 
CDS 49997. .50171 



>gi | 24429581 1 ref |NM_153813. l| Homo sapiens friend of GATA-1 (FOG1) , mRNA 
Identities = 14/14 (100%) 



Query: 475 gggcgcggccggcc 487 

111 IIIIIIIMM 

Sbjct: 2503 gggcgcggccggcc 2490 
CDS 323.-3337 

>gi | 22 094134 | ref |NM_032482 . 1 | Homo sapiens histone methyltransf erase DOT1L 
(D0T1L) , mRNA 

.tities = 14/14 (100%) 




476 ggcgcggccggccg 489 

mil mi mil 

Sbjct: 2314 ggcgcggccggccg 2301 

CDS 37.. 4650 

functions "methylates lysine 79 of histone H3" 



>gi 1 4759111 1 ref |NM_004207 . 1 | Homo sapiens solute carrier family 16 
(monocarboxylic acid transporters) , member 3 (SLC16A3) , mRNA 
Identities = 14/14 (100%) 



Query: 477 gcgcggccggccgc 4 90 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 891 gcgcggccggccgc 904 
CDS 63.. 1460 



>gi | 20544351 1 ref | XM_005702 . 8 | Homo sapiens wingless-type MMTV integration site 
family, member 8B (WNT8B) , mRNA 
Identities = 14/14 (100%) 



w 



ery: 477 gcgcggccggccgc 4 90 

e 1 1 1 1 1 1 : 1 1 1 1 1 1 

jet: 808 gcgcggccggccgc 821 
CDS 12 9.. 1184 



>gi|23452045|gb|AF494409.l| Homo sapiens pantothenate kinase 2 mRNA, complete 
cds 

Identities = 15/15 (100%) 
Query: 480 cggccggccgcctct 4 94 

II ll 1 1 Ml ill ill 

Sbjct: 279 cggccggccgcctct 265 
CDS 7.. 1719 

gi|2213644|gb|U63833.l|HSU63833 Human PAX 6 gene, promoter region and exons 1 
and 2 

Identities = 16/16 (100%) 
Query: 482 gccggccgcctctgct 497 

IIIIIIIIIIIIIIII 

Sbjct: 114 gccggccgcctctgct 129 



32 




promoter 1 . - 3274 

/note="isoform 2 is encoded by transcript variant 2; ortholog of mouse CNR5; 
KIAA0345-like 1" 

>gi| 14589892|ref |NM_001794 . 2 | Homo sapiens cadherin 4, type 1, R-cadherin 
(retinal) ( CDH4 ) , mRNA 
Identities a 15/15 (100%) 

Query: 483 ccggccgcctctgct 497 

llillliiinilll 

Sbjct: 2841 ccggccgcctctgct 2827 
CDS 15. .2765 

This gene is a classical cadherin from the cadherin superfamily. The encoded 
protein is a calcium- dependent cell-cell adhesion glycoprotein, studies 

>gi| 11545830 j ref | NM_022114 . 1 1 Homo sapiens PR domain containing 16 (PRDM16) , 
mRNA/ Identities = 15/15 (100%) 

Query: 483 ccggccgcctctgct 497 

1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 

k : 1638 ccggccgcctctgct 1652 
1..4376 

>gi 1 14165396 | ref |NM_031865 . 1 1 Homo sapiens protocadherin alpha 13 (PCDHA13) , 
transcript variant 2, 
Identities = 16/16 (100%) 

Query: 484 cggccgcctctgctgc 499 

MM III INI Mill 

Sbjct: 2268 cggccgcctctgctgc 2253 
CDS 1..2424 

>gi| 1269731l|emb|AJ295990.l|HSA295990 Homo sapiens mRNA for putative chromatin 
modulator, alternative splice NSD3L 
Identities = 15/15 (100%) 

Query: 485 ggccgcctctgctgc 499 

1 1 M II M II M I M 

Sbjct: 4514 ggccgcctctgctgc 4528 
CDS 314.. 4627 

ote= "alternative splice NSD31i n 

- | 12642816 |gb|AF332469.l|AF332469 Homo sapiens putative protein WHSC1L11 
ClLl) mRNA, complete cds, alternatively spliced 
dentities a 15/15 (100%) 

Query: 485 ggccgcctctgctgc 4 99 

1 1 1 1 1 f l ] 1 1 1 1 1 1 1 

Sbjct: 4719 ggccgcctctgctgc 47 33 
CDS " 519.. 4832 

>gi| 17474463 | ref | XM_062506 . 1 | Homo sapiens similar to 60S acidic ribosomal 
protein P2 (LOC121193) , mRNA 
Identities = 15/15 (100%) 

Query: 485 ggccgcctctgctgc 499 

II II II I I II II II I 
Sbjct: 278 ggccgcctctgctgc 292 
CDS 1..351 

product=" similar to 60S acidic ribosomal protein P2" 



>gi| 22035673) ref |NM_ 006031.2] Homo sapiens pericentrin 2 (kendrin) (PCNT2) , 
itlRHA 

Score = 30.2 bits (15) r Expect = 88 
Identities = 15/15 (100%) 

Query: 487 ccgcctctgctgcag 501 

Illllllllllllll 

Sbjct: 3442 ccgcctctgctgcag 3428 

CDS 53.. 10063 

The protein encoded by this gene binds to calmodulin and is expressed in the 
centrosome . 



>gi | 12620204 | gb | AF288398 . 1 1 AF288398 
Identities = 16/16 (100%) 



Homo sapiens Clorfl4 mRNA, complete cds 



Query: 489 gcctctgctgcagatg 504 

IIIIMIII lllllll 

Sbjct: 1282 gcctctgctgcagatg 1267 
CDS 69. .2246 

Le= M alternatively spliced" 




522520 | gb | AF173157 . 1 | AF173157 
Fete cds • 
Identities = 16/16 (100%) 



Homo sapiens MSTP098 (MST098) mRNA, 



Query: 489 gcctctgctgcagatg 504 

in iiiiiiiiiii ii 

Sbjct: 329 gcctctgctgcagatg 314 
CDS 239.. 460 

>gi | 22 046810 | ref |XM_089096.2 | Homo sapiens similar to coxsackievirus and 
adenovirus receptor-like protein (LOC163724) , mRNA 
Identities = 15/15 (100%) 

Query: 490 cctctgctgcagatg 504 

illllllllllllll 

Sbjct: 578 cctctgctgcagatg 564 
CDS 291.. 1466 

misc feature 552.. 674 



i | 20070194 | ref | NM_006140 . 2 | Homo sapiens colony stimulating factor 2 
eptor, alpha, low-affinity (granulocyte -macrophage) (CSF2RA) , mRNA 
tities = 17/18 (94%) 



ery: 512 tctgcgaccagtggcacc 529 

lllllll iiiiiiiili 

Sbjct: 248 tctgcgaacagtggcacc 265 

CDS 171.. 1373 

>gi | 15990415 | gb | BC015569 . 1 | BC015569 
protein, 

Identities = 14/14 (100%) 



Homo sapiens, Similar to SRp25 nuclear 



Query: 517 gaccagtggcaccg 430 

1 1 1 ] 1 1 1 1 1 1 f 1 1 1 

Sbjct: 4 06 gaccagtggcaccg 419 
CDS 37.. 684 



>gi | 13624213 | gb | AF319045 . 1 | AF319045 
2 (CNTNAP2) mRNA, complete 
Identities = 14/14 (100%) 



Homo sapiens contactin-associated protein 



Query: 517 gaccagtggcaccg 53 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 2778 gaccagtggcaccg 2791 
CDS 141.. 4136 



>gi 1 14702161 1 ref |NM_032421 . 1 1 Homo sapiens cytoplasmic linker 2 (CYXiN2) , 
transcript variant 2 , 
Identities = 14/14 (100%) 

Query: 519 ccagtggcaccgcc 532 

llllllllllllll 

Sbjct: 314 ccagtggcaccgcc 327 
CDS 328. .3363 

note=" synonyms: WSCR4, WBSCR4, CLIP-115, KIAA0291, MGC11333" 
note="isoform 2 is encoded by transcript variant 2; 
Williams -Beuren syndrome chromosome region 4" 

>gi | 22044320 | ref | XM_086178 . 5 | Homo sapiens agrin (AGRN) , mRNA 
tities = 14/14 (100%) 




m 



419 ccagtggcaccgcc 432 

llllllllllllll 
Sbjct: 4325 ccagtggcaccgcc 4338 

CDS 366. .6107 

>gi | 4885506 | ref |NM_005468 . 1 | Homo sapiens N-acetylated alpha-linked acidic 
dipeptidase-like; ILEAL DIPEPTIDYLPEPTIDASE (NAALADASEL) , mRNA 
Identities = 14/14 (100%) 

Query: 520 cagtggcaccgccg 533 

llllllllllllll 

Sbjct: 1156 cagtggcaccgccg 1169 

CDS 17.. 2239 

/ function^ "peptidase " 

>gi | 23943861 1 ref |NM_020378 . 1 1 Homo sapiens K562 cell-derived leucine- zipper- 
like protein 1 (KLP1) , mRNA 
Identities = 15/15 (100%) 
Query: 523 tggcaccgccgccgg 538 

I ] 1 1 1 1 1 1 1 1 M i i I 

jet: 486 tggcaccgccgccgg 500 
S 90.. 710 

te="K562 cells-derived leucine- zipper- like protein 1" 



>gi | 20384683 | gb | AY030095 . 1 1 Homo sapiens pancreasin mRNA, complete cds 
Identities = 17/17 (100%) 

Query: 524 ggcaccgccgccggccg 540 

ill llllllllllllll 

Sbjct: 23 ggcaccgccgccggccg 7 

CDS 1..873 
note="CAPH2; channel -activating protease 2; tryptic serine protease; similar to 
marapsin" 

>gi|20552317 | ref |XM_096904.4 | Homo sapiens Kruppel-like factor 13 (KIiF13) , 
Identities = 15/15 (100%) 

Query: 525 gcaccgccgccggcc 53 9 

llllllllllllll! 

Sbjct: 20 gcaccgccgccggcc 34 
CDS 47 . . 913 



35 



note-" synonyms: BTEB3, FKLF2, NSLP1, FKLF-2, RFLAT1, RFIAT-1" 
/product =" similar to Krueppel-like factor 13 

>gi 1 14727714 | ref | XM_045113 . 1 1 Homo sapiens astrotactin (ASTN) , mRNA 
Identities = 15/15 (100%) 



Query: 525 gcaccgccgccggcc 539 

I Mill IIIIIIIM 

Sbjct: 72 gcaccgccgccggcc 58 

CDS 15.. 3899 

product- "similar to KIAA0289" 

>gi I 22538424 | ref |NM_145691 . 2 | ' Homo sapiens ATP synthase mitochondrial Fl 
complex assembly factor 2 (ATPAF2) , nuclear gene encoding mitochondrial protein, 
Identities = 14/14 (100%) 



Query: 525 gcaccgccgccggc 538 

IIIIIIIM 1 1 Ml 

Sbjct: 947 gcaccgccgccggc 960 
154.. 1023 




065230 | ref [ XM_035037 . 2 | Homo sapiens low density lipoprotein receptor- . 
fed protein 4 (LRP4) , mRNA 
Identities = 14/14 (100%) 

Query: 526 caccgccgccggcc 539 

1 1 1 ll li ll l II 1 1 

Sbjct: 2107 caccgccgccggcc 2120 

CDS 232.. 4839 

product=" similar to MEGF7" 

>gi | 20545806 | ref | XM_007 095 . 6 | Homo sapiens insulin receptor substrate 2 
(IRS2) , mRNA 

Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

M 1 1 i I ! 1 1 1 ) M I 

Sbjct: 3613 caccgccgccggcc 3626 
CDS 516.. 4532 

i | 4506228 | ref |NM_002809 . 1 1 Homo sapiens proteasome (prosome, macropain) 26S 
unit, non-ATPase, 3 (PSMD3) / mRNA 
ntities = 14/14 (100%) 



ery: 526 caccgccgccggcc 53 9 

1 1 1 1 1 1 1 1 1 1 1 1 ! i 

Sbjct: 237 caccgccgccggcc 250 
CDS 158.. 1762 

>gi|l657753|gb|U63721.l|HSU63721 Human elastin (EIJJT) gene, partial cds, and 
LIM- kinase (LIMK1) gene, 
Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

MMMMIMMI 

Sbjct: 23610 caccgccgccggcc 23597 
exon 23511.. 23730 

/gene= " LIMK1 11 

>gi|582355l|gb|AF180522.l|AF180522 Homo sapiens intersectin short form 2 
(ITSN) mRNA, partial cds 



Identities = 14/14 (100%) 



Query: 526 caccgccgccggcc 539 

Mill I Mill I II 

Sbjct: 158 caccgccgccggcc 171 
CDS <1..566 

>gi|l81652|gb|M85247.l|HOMDOPAM H. sapiens dopamine D1A receptor gene, complete 
exon 1 , and exon 2 , 5 1 end 
Identities = 14/14 (100%) 

Query: 531 ccgccggccgttct 543 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 1097 ccgccggccgttct 1110 

misc_signal 842 . . 1231 

function= "negative trancriptional modulator" 

>gi|23395757 j tpg | BK000395 . 1 | TPA: Homo sapiens aflatoxin Bl-aldehyde reductase 
(AKR7A2 ) mRNA, 

tities = 14/14 (100%) 

: 544 tcgccaccgcccag 567 

_ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 312 tcgccaccgcccag 299 

CDS 23.. 1102 

/note= n aldo-keto reductase; serves as a gamma -hydroxybutyrate synthase; the 
full-length protein is predicted to contain 29 additional amino acids at the 
N- terminus that have not been recognized previously" 

>gi|77 06102 |ref | NM_016568 . 1 1 Homo sapiens G-protein coupled receptor SALPR; 
somatostatin andangiotensin-like peptide receptor (SALPR) , mRNA 
Identities = 14/14 (100%) 

Query: 547 ccaccgcccagaag 560 

Minimum 

Sbjct: 781 ccaccgcccagaag 768 

CDS 361.. 1770 

misc_feature 697.. 1527 

note="7tm_l; Region: 7 transmembrane receptor (rhodopsin 
family) " 

i 1 18568985 | ref | XM_095373 . 1 1 Homo sapiens similar to Neutrophil defensin 4 
ecursor (HNP-4) (HP4) (Defensin, alpha 4) (LOC157295) , mRNA 
dentities = 14/14 (100%) 

Query: 552 gcccagaagcagcc 565 

1 1 1 1 1 1 1 1 1 m 1 1 

Sbjct: 181 gcccagaagcagcc 194 

CDS " 1/.375 

mi'sc_f eature 145 . . 243 

>gi 1 22053899 | ref | XM_092083 . 2 | Homo sapiens similar to golgi autoantigen, 
golgin subfamily a, 2; golgin-95 (LOC163220) , mRNA 
Identities =14/14 (100%) 

Query: 552- gcccagaagcagcc 565 

iiiiiiiiiimi 

Sbjct: 505 gcccagaagcagcc 518 
CDS 1. .1452 




>gi 1 22053411 1 ref | XM_050604 . 4 | Homo sapiens AIE-75 binding protein protein 
(MCC2) , mRNA 

Identities = 14/14 (100%) 
Query: 553 cccagaagcagccc 566 

MINIMI Mill 

Sbjct: 407 cccagaagcagccc 420 
CDS 114.. 2225 

>gi | 4505326 | ref |NM_000263 . 1 | Homo sapiens N-acetylglucosaminidase, alpha - 
(Sanf ilippo disease IIIB) (NAGLU) , mRNA 
Identities = 17/18 (94%) 

Query: 553 gcccagaagcagcccgcc 569 

IMMIIMI 1 1 1 11 II 

Sbjct: 1609 gcccagaagctgcccgcc 1626 

CDS 333.-2564 
/function^" one of four enzymes involved in the degradation of heparan sulfate; 
specifically removes the alpha -N- acetyl glucosamine residues" 

5718672 | ref |NM_000683.2 | Homo sapiens adrenergic, alpha-2C-, receptor 
C) , mRNA 

Lties = 14/14 (100%) 
Query: 553 cccagaagcagccc 566 

1 1 1 1 1 1 1 1 1 i 1 1 1 1 

Sbjct: 2530 cccagaagcagccc 2517 

CDS 892.. 2277 

/note= » alpha2 -AR-C4 « 

/product="alpha-2C-adrenergic receptor" 

>gi 1 15812179 | ref |NM_004 926 . 2 | Homo sapiens zinc finger protein 36, C3H type- 
like 1 (ZFP3 6L1) , mRNA 
Identities = 15/15 (100%) 

Query: 553 cccagaagcagcccg 578 

M 1 1 M 1 1 1 1 1 1 M I 

Sbjct: 432 cccagaagcagcccg 446 

CDS 131. .1147 . . 

/note="EGF-response factor 1; early response factor Berg36; zinc finger protein, 

[3H type, 36 -like 1" 
roduct="butyrate response factor l n 




gi | 20556994 | ref | XM_039877 . 5 ] Homo sapiens mucin 5, subtype B, 
tracheobronchial (MDC5B) , mRNA 
Identities = 17/18 (94%) 

Query: 555 cagaagcagcccgccgcc 572 

IIIIIMIIill MMI 

Sbjct: 1580 cagaagcagccctccgcc 1563 
CDS 46 . .2688 

/ db_xr e f = n MIM : 600770" 

>gi | 22060317 | ref |XM_114498 . 2 | Homo sapiens similar to Tcte-l peptide 
(LOC202500) , mRNA 
Identities = 14/14 (100%) 

Query: 556 agaagcagcccgcc 569 

1 1 1 1 1 1 1 1 1 M I M 

Sbjct: 1317 agaagcagcccgcc 1330 
CDS 346.. 1401 
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>gi | 4505032 | ref | NM__000752 . 1 1 Homo sapiens leukotriene B4 receptor (LTB4R) , 
Identities = 19/20 (95%) /note="Cnemokine receptor-like 1 

Query: 559 agcagcccgccgccggcgca 578 

Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 2595 agcaggccgccgccggcgca 2576 CDS: 1718.. 2776 

>gi| 1648869 |emb|X98356.l|HSGPCRCO H. sapiens mRNA for G protein- coupled 
receptor 

Identities = 19/20 (95%) 

Query: 559 agcagcccgccgccggcgca 578 

Hill llllllllllllll 

Sbjct: 1266 agcaggccgccgccggcgca 1247 CDS: 389.. 1447 

>gi | 5032110 | ref | NMJD05634 . 1 1 Homo sapiens SRY (sex determining region Y) -box 3 
(SOX3) , mRNA 
a^ntities = 15/15 (100%) 

Ji 559 agcagcccgccgccg 573 

WW miiiiiniiiii 

Sbjct: 862 agcagcccgccgccg 876 
CDS 1. .1332 

>gi | 2054B635 | ref |XMJL67923 . 1 1 
Identities = 14/14 (100%) 

Query: 560 gcagcccgccgccg 573 

llllllllllllll 

Sbjct: 116 gcagcccgccgccg 129 
CDS 49.. 843 

>gi| 8923792 | ref | NM_017514 . 1 | 
(PLXN3 ) , mRNA 
Identities = 14/14 (100%) 

Query: 561 cagcccgccgccgg 574 

llllllllllllll 

jet: 2896 cagcccgccgccgg 2909 
S 185.. 5800 

gi|924712l|gb|AF284224.l|AF284224 Homo- sapiens DMRT2 and terra-like protein 
(DMRT2) bicistronic mRNA, 
Identities = 16/16 (100%) 

Query: 561 cagcccgccgccggcg 576 

iiiiiiiiiiiiiiii 

Sbjct: ill cagcccgccgccggcg 126 

CDS 1..681 
/note= "putative transcription factor" 

>gi| 6179565 |emb|Y19052.l|HOSA19052 Homo sapiens mRNA for doublesex-like 2 
protein (DSXL-2 gene) 
Identities = 16/16 (100%) 
Strand = Plus / Plus 

Query: 561 cagcccgccgccggcg 576 

IIIIIIIIIIIIIIII 

Sbjct: 565 cagcccgccgccggcg 580 



' Homo sapiens homeobox protein Gsh-1 (Gsh-1) , 



Homo sapiens likely ortholog of mouse plexin 3 



CDS 



455. .1135 



>gi | 14165271 | ref | NM_0324 09 . l| 

(PINK1) , mRNA 

Identities » 14/14 (100%) 

Query: 561 cagcccgccgccgg 574 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 213 cagcccgccgccgg 200 

CDS 95.. 1840 

/not e= "protein kinase BRPK" 

>gi | 21536278 | ref | NM_006371 . 2 | 

(CRTAP) , mRNA 

Identities « 14/14 (100%) 



Homo sapiens PTEN induced putative kinase 1 



Homo sapiens cartilage associated protein 



Query: 562 agcccgccgccggc 575 

IIMIIIIIIIIII 

Sbjct: 295 agcccgccgccggc 308 
•S 12.. 1217 

uman cartilage associated protein is homologous to the chick and mouse 
genes . 

>gi | 4504646] ref |NM_001560.l| Homo sapiens' inter leukin 13 receptor, alpha 1 
(IL13RA1) , mRNA 
Identities = 15/15 (100%) 




Query: 564 cccgccgccggcgca 578 

1 1 III I II I Ml I II 

Sbjct: 103 cccgccgccggcgca 89 
CDS 44.. 1327 

>gi | 4507206 | ref |NM_003130 .l| 
Identities = 14/14 (100%) 

Query: 564 cccgccgccggcgc 577 

IIMIIIIIIIIII 

Sbjct: 48 cccgccgccggcgc 35 
CDS 13.. 609 



Homo sapiens sorcin (SRI) , mRNA 



Homo sapiens mitogen -activated protein kinase 



i | 21735549 | ref | NM_002446 . 2 | 
nase kinase 10 (MAP3K10) , mRNA 
entities = 15/15 (100%) 

Query: 576 cagcccgccgccggc 590 

iiinilliiliiii 

Sbjct: 2885 cagcccgccgccggc 2899 
CDS 289.. 3153 

/note= "mixed lineage kinase 2; MKN28 kinase; MKN28 derived 
nonreceptor_type serine/ threonine kinase" 

>gi 1 18548972 | ref | XM_089318 . 1 1 Homo sapiens similar to ATP-dependent DNA 
helicase MER3 (HFM1 protein) (LOC164045) , mRNA 
Identities = 14/14 (100%) 

Query: 580 ttcttcccgccgcc 593 

IIMIIIIIIIIII 

Sbjct: 67 ttcttcccgccgcc 80 
CDS 1..2196 
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>gi 1 13929461 1 ref | NM_001497 . 2 | Homo sapiens UDP-Gal :betaGlcNAc beta 1,4- 
galactosyltransf erase, polypeptide 1 (B4GALT1) , mRNA 
Identities = 14/14 (100%) 

Query: 581 tcttcccgccgccg 595 

llllll II MM 1 1 

Sbjct: 73 tcttcccgccgccg 60 
CDS 73.. 1269 

>gi 1 21359847 | ref | NM_001194 . 2 | Homo sapiens hyperpolarization activated cyclic 
nucleotide-gated potassium channel 2 (HCN2) , mRNA 
Identities = 14/14 (100%) 

Query: 581 tcttcccgccgccg 594 

1 1 ) 1 1 1 1 i 1 1 1 1 1 1 

Sbjct: 2191 tcttcccgccgccg 2204 

CDS 54 . .2723 

function= "pacemaker channel of human heart" 

|te-» cyclic nucleotide -gated; brain cyclic nucleotide gated channel 2 

»032269|gb|AF274003.l|AF274003 Homo sapiens splicing- related factor RNPS1 
W) mKNA, complete cds, alternatively spliced 
Kities = 14/14 (100%) 

Query: 581 tcttcccgccgccg 594 

1 1 1 1 1 1 1 1 n 1 1 1 1 

Sbjct: 46 tcttcccgccgccg 33 
CDS 46. . 894 

>gi 1 4504382 | ref |NM_001528 . 1 | Homo sapiens HGP activator (HGFAC) , mRNA 
Identities = 15/15 (100%) 

Query: 590 cgccgttcttctcgc 604 

lllllllllllllll 
Sbjct: 1828 cgccgttcttctcgc 1814 
CDS 4.. 1971 

>gi| 1419647 0 | ref |NM_032054 . 1 | Homo sapiens protocadherin gamma subfamily A, 5 
(PCDHGA5) , transcript variant 2, mRNA 
identities = 14/14 (100%) 

|ery: 600 ctcgccgttcttct 613 

1MIIIII1III1! 

Jbjct: 2416 ctcgccgttcttct 2403 
CDS 1. .2442 

cadherin ME 3 " 

/protein id= "NP 114443.1" , t . . . 

These gene clusters have an immunoglobulin- like organizatxon, suggestxng that a 
novel mechanism may be involved in their regulation and expression. 

>gi 119923446 | ref |NM_015963 . 2 | Homo sapiens CGI-36 protein (CGI-36) , mRNA 
Identities = 14/14 (100%) 

Query: 60 0 ctcgccgttcttct 613 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 947 ctcgccgttcttct 934 
CDS 807.. 1565 

>gi| 21314399 |gb|AFS08782.l| Homo sapiens fibroblast growth factor 10 (FGF10) 
mRNA, partial cds 
Identities = 14/14 (100%) 
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Query: 604 ccgttcttctcaat 617 

iiimiimiii 

Sbjct: 173 ccgttcttctcaat 160 
CDS <1..513 

/£unction= "paracrine growth factor for epithelia" 
/note= n keratinocyte growth factor- 2; KGF2; produced by 
fibroblasts of urinary bladder lamina propria" 

>gi | 22058975 | ref |XM_172182 . 1 | Homo sapiens similar to Ribosomal protein S5; 
Minuted) 15D; Minute; transcript e (LOC255793) , mRNA 
Identities = 14/14 (100%) 

Query: 606 gttcttctcaatgg 619 

Mill MINIM I 

Sbjct: 405 gttcttctcaatgg 392 
CDS 1..438 



>gi | 24797096 | ref |NM_006907 . 2 | Homo sapiens pyrroline- 5 - carboxylate ^ reductase 1 
:R1) , nuclear gene encoding mitochondrial protein, transcript variant 

ities = 14/14 (100%) 



>gi | 24* 
^^■^CRl 



( 



Query: 607 ttcttctcaatgga 620 

MIIIIMIIMII 

Sbjct: 598 ttcttctcaatgga 585 

CDS 279.. 1238 

/note="isoform 1 is encoded by transcript variant 1; P5C 
reductase" 

>gi]4186165|gb|L41919.l|HUMHIClG Homo sapiens candidate tumor suppressor HIC-1 
(HIC-1) gene, complete 
Identities = 20/21 (95%) 

Query: 626 cgccccggccgcgccgcccgc 646 

illlllllllllllll mi 

Sbjct: 2451 cgccccggccgcgccggccgc 2431 CDS: 637.. 2781 

Isolation and embryonic expression of the novel mouse gene Hicl,the homologue of 
HIC1, a candidate gene for the Miller-Dieker syndrome 

i | 23238250 |ref |NM_032862 . 2 | Homo sapiens tigger transposable element derived 
(TIGD5) mRNA,' 
entities = IB/19 (94%) 



ery:626 cgccccggccgcgccgccc 644 

I MM Mill Mill Ml 

Sbjct: 510 cgccccggccccgccgccc 528 
CDS 1..1782 

>gi | 17939629 |gb | BC019288 .l|BC019288 Homo sapiens, hepatocyte nuclear factor 3, 
beta, clone 

Identities « 18/19 (94%) 

Query: 626 cgccccggccgcgccgccc 644 

iiiiiiinii mini 

Sbjct: 284 cgccccggccgagccgccc 266 

CDS <1. .1370 

/products "hepatocyte nuclear factor 3, beta" 

>gi | 22041040 | ref |XM_092478 . 2 | Homo sapiens similar to Gliacolin (LOC165257) , 
mRNA 
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Identities = 21/23 (91%) 



Query: 628 ccccggccgcgccgcccgccacc 650 

iiiiini "in inn 

Sbjct: 810 ccccggccccgccgcccaccacc 7 88 

CDS 471.. 1262 

/product=" similar to Gliacolin" 

>gi| 17974541 |gb|AF361354.l|AF361354 Homo sapiens voltage -dependent calcium 
channel gamma -8 subunit (CACNG8) mRNA, complete cds 
Identities = 16/16 (100%) 

Query: 628 ccccggccgcgccgcc 643 

I III Mill II Mill 

Sbjct: 1132 ccccggccgcgccgcc 1117 
CDS 106.. 1386 

>gi | 24475868 | ref |NM_153836 . 1 1 Homo sapiens cellular repressor of E1A- 
£imulated genes 2 (CREG2) , 
tities « 19/20 (95%) 




628 ccccggccgcgccgcccgcc 647 

iiiiiiiiiiini inn 

Sbjct: 177 ccccggccgcgccggccgcc 158 
CDS 139.. 1011 

>gi | 21237772 | ref | NMJ316431 . 2 | Homo sapiens mitogen- activated protein kinase 8 
interacting protein 2(MAPK8IP2), transcript variant 2, mRHA 
Identities = 19/19 (100%) 

Query: 629 cccggccgcgccgcccgcc 54 7 

III II MM I! I MINN 

Sbjct: 1276 cccggccgcgccgcccgcc 1294 

CDS 1..2394 . 

/note=«PRKM8 interacting protein-like; JNK- interacting protein 2; islet-brain 2 
ONK MAP kinase scaffold protein JTP2 ; homologous to mouse 0TP-1" 

>gi 1 14971412 | ref | NMJD15906 . 2 | Homo sapiens tripartite motif -containing 33 
(TRIM33), transcript variant alpha, mRNA 
dentities = 16/16 (100%) 

ery: 629 cccggccgcgccgccc 644 

iniilllililllll 

Sbjct: 267 cccggccgcgccgccc 252 
• CDS 85 . .3468 

>gi|l3183792|gb|AF336133.l|AF336133 Homo sapiens CECR2 protein (CECR2) mRNA, 
complete cds 

Identities = 16/16 (100%) 
Query:.629 cccggccgcgccgccc 644 

MM MINIMI Ml 

Sbjct: 448 cccggccgcgccgccc 433 

CDS 419. .4873 . 

>gi (22 046663 | ref | XM_047536 . 6 | Homo sapiens obscurin, cytoskeletal calmodulin 
and ti tin- interacting RhoGEF (OBSCN) , mRNA 
Identities = 15/15 (100%) 

Query: 631 cggccgcgccgcccg 645 

III I lllllll I III 
Sbjct: 572 cggccgcgccgcccg 558 



CDS 45.. 18518 

/products "similar to obscurin" 

>gi| 21707308 |gb|BC033826.l| Homo sapiens, purinergic receptor P2X, ligand- 
gated ion channel, 4, clone MGC: 45331 IMAGE: 5216449, mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 632 ggccgcgccgcccgc 646 

MINI INI Mill 

Sbjct: 24 ggccgcgccgcccgc 10 
• CDS 25. .1191 

/product= "purinergic receptor P2X, ligand-gated ion c han nel, 4" 

>gi | 21450823 | ref [NM_145056 . 1 | Homo sapiens thymus expressed gene 3-like 
(MGC15476) , mRNA 
Identities = 16/16 (100%), 

Query: 632 ggccgcgccgcccgcc 647 

1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

£: 879 ggccgcgccgcccgcc 894 
441.. 1655 




2652729 I gb I AF48 9858.1 1 Homo sapiens serum amyloid A activating factor 2 
mRNA, complete cds 
Identities = 16/16 (100%) 

Query: 632 ggccgcgccgcccgcc 647 

MM I II II llllll I 

Sbjct: 550 ggccgcgccgcccgcc 565 

CDS 113.. 1594 

/note= n transcription factor SAF-2" 

>gi | 20558544 | ref |XM_028783 . 2 | Homo sapiens opioid growth factor receptor 
(OGFR) , mRNA 

Identities = 15/15 (100%) 
Query: 632 ggccgcgccgcccgc 646 

lllllllllllllll 

Sbjct: 174 ggccgcgccgcccgc 160 
CDS 17.. 2050 

roduct=" similar to 7-60 protein" 

i|22042730|ref |XM_114346.2 | Homo sapiens similar to source of immunodominant 
C-associated peptides (LOC201595) , mRNA 
Identities = 15/15 (100%) 



Query: 633 gccgcgccgcccgcc 647 

lllllllllllllll 

Sbjct: 345 gccgcgccgcccgcc 331 
CDS 200 . .2680 

/product^" similar to source of immunodominant MHC- associated peptides" 

>gi|4507162|ref |NM_003107.1| Homo sapiens SRY (sex determining region Y) -box 4 
(SOX4) , mRNA 

Identities = 16/16 (100%) 
Query: 634 ccgcgccgcccgccac 649 

MMIIIIMIIMII 

Sbjct: 972 ccgcgccgcccgccac 957 
CDS 351.. 1775 
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gi I 23395757 j tpg | BK000395 . 1 1 
(AKR7A2) mRNA, 
Identities = 18/19 (94%) 



TPA: Homo sapiens aflatoxin Bl -aldehyde reductase 



Query: 640 cgcccgccaccgccgcggc 658 

MINIMI MINIMI 

Sbjct: 180 cgcccgccagcgccgcggc 198 
CDS ' 23.. 1102 

>gi|5032110|ref |NM_005634 . 1 | Homo sapiens SRY (sex determining region Y) -box 3 
(SOX3) , mRNA 

Identities = 18/18 (100%) 

Query: 641 gcccgccaccgccgcggc 658 

IIIIIIMIIIIIIIIII 

Sbjct: 1044 gcccgccaccgccgcggc 1061 
CDS 1. .1332 

>gi | 20589957 | ref |NM_139075 . 1 ) Homo sapiens two-pore calcium channel protein 2 
WBiL " — ) , mRNA 



ties - 15/15 (100%) 



:643 ccgccaccgccgcgg 657 

1 1 Mill II I INN 

Sbjct: 160 ccgccaccgccgcgg 146 
CDS 102.. 2360 

>gi 1 16753218 | ref |NM_033224 . 2 | ' Homo sapiens purine-rich element binding protein 
B (PURB) , mRNA 
Identities = 15/15 (100%) 

Query: 643 ccgccaccgccgcgg 657 

iiiiiiiiiiiiiii 

Sbjct: 480 ccgccaccgccgcgg 466 
CDS 14 . . 952 

>gi|291945|gb|L12398.l|HUMD4C Homo sapiens dopamine receptor D4 (DRD4) mRNA, 
complete cds 

Identities = 15/15 (100%) 

ery:643 ccgccaccgccgcgg 657 

iiiiiiiiiiiiiii 

jet: 502 ccgccaccgccgcgg 4 88 
CDS 1. .1404 

>gi|l9401873|gb|AF479827.l| Homo sapiens protein kinase-like protein mRNA, 
complete cds 
Identities = 18/19 (94%) 

Query: 644 cgccaccgccgcggctggg 662 

, mum mini 

Sbjct: 1907 cgccaccgccggggctggg 1889 
CDS 278.. 2614 

>gi|7542578|gb|AF241229.l|AF241229 Homo sapiens GITR-D mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 651 gccgcggctgggccc 665 

IIIIIIIIIIIIIII 

Sbjct: 682 gccgcggctgggccc 696 CDS: 1..768 



>gi 1 23238193 |ref|NM_148901.1 I . Homo sapiens tumor necrosis factor receptor 
superfamily, member 18 (TNFRSF18) , transcript variant 2, mRNA 
Identities = 15/15 (100%) 

Query: 652 gccgcggctgggccc 666 

1 1 1 II ! M 1 1 1 1 1 1 1 

Sbjct: 820 gccgcggctgggccc 834 CDS : 139.. 906 

>gi 1 11038623 | ref |NM__004426 . 1 1 Homo sapiens polyhomeotic-like 1 (Drosophila) 
(PHC1) , mRNA 

Identities = 15/15 (100%) 
Query: 671 tcttcacccttgtct 685 

ii m i inn I iii i 

Sbjct: 1644 tcttcacccttgtct 1658 

CDS 210.. 3224 

/not e= n early development regulator 1; mouse Rae28-like n 
>gi|l90395|gb|M60494.l|HUMPROFIIiA Human prof ilaggrin gene, 3' end 
Identities = 15/15 (100%) 



678 ccttgtcttcgtcca 692 

III 1 1 MM 1 1 1)11 

: 4236 ccttgtcttcgtcca 4222 
exon 949.. 4447 

CDS 1478.. 4447 



>gi | 24475953 | ref | NM_013433 . 2 | Homo sapiens karyopherin beta 2b, transportin 
(TRN2) , mRNA 

Identities = 14/14 (100%) 
Query: 678 ccttgtcttcgtcc 691 

Mill MINIMI 

Sbjct: 202 6 ccttgtcttcgtcc 2013 

CDS 292.. 2955 

/note= "hypothetical protein FLJ12155" 

>gi | 8923472 | ref | NM_017852 . 1 | Homo sapiens NALP2 protein (NALP2) , mRNA 
Identities = 15/15 (100%) 

Query: 685 ttcgtccacgtctag 699 

1 1 1 1 1 M II 1 1 1 1 1 1 

t: 453 ttcgtccacgtctag 439 
CDS 88.. 3276 

bt e= " PYRIN- Containing APAF1 - like " 

>gi|l0198206|gb|AF298547.l| Homo sapiens nucleotide -binding site protein 1 
mRNA, complete cds 
Identities = 15/15 (100%) 

Query: 685 ttcgtccacgtctag 699 

llllllliliiiin 

Sbjct: 425 ttcgtccacgtctag 411 

CDS 78. .3179 ■ 

/note="NBSl; nucleotide-binding site/leucine-rich repeat 
(NBS/LRR) family member" 

>gi 1 4504576 | ref |NM_002164 . 1 1 Homo sapiens indoleamine -pyrrole 2,3 dioxygenase 
(INDO) , mRNA 

Identities = 17/17 (100%) 

Query: 691 cacgtctagttctggga 707 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ] 

Sbjct: 258 cacgtctagttctggga 274 
CDS 23. .1234 

>Numatrin) pseudogene and the MDFI gene for MyoD family inhibitor (myogenic 
repressor I-MF 
Identities = 15/15 (100%) 

Query: 697 tagttctgggacctc 711 

MINI MINIMI 

Sbjct: 64761 tagttctgggacctc 64775 

CDS complement (64067. .64810) 

/note= n dJ696P19 .2 (NPM1 (Nucleophosmin, Numatrin) pseudogene) 

>gi | 22047835 | ref |XM_095174 . 3 | Homo sapiens similar to pol protein (LOC168550) , 
mRNA 

Identities = 14/14 (100%) 
Query: 699 gttctgggacctcc 712 

illlillllillll 

1249 gttctgggacctcc 1262 
IMl 1..3315 

>gi ] 4506508 | ref |NM_002926 . 1 1 Homo sapiens regulator of G-protein signalling 12 
(RGS12), mRNA 
Identities = 15/15 (100%) 

Query: 700 ttctgggacctcccg 714 

I II Ml I II M 1 1 II 

Sbjct: 2786 ttctgggacctcccg 2772 CDS: 55.. 4185 

>gi | 22771013 | gb | AF542391 . 1 1 Homo sapiens selectin P (granule membrane protein 
140kDa, antigen CD62) (SELP) gene, complete cds 
Identities = 17/18 (94%) 

Query: 705 ggacctcccgctcaagag 722 

linilli iniliiii 

Sbjct: 6869 ggacctcctgctcaagag 6886 
gene <1. . >398 

' | 4758621 | ref |NM_004770 . 1 | Homo sapiens potassium voltage-gated channel, 

-related subfamily, member 2 (KCNB2) , mRNA 
ntities = 14/14 (100%) 

Query': 711 cccgctcaagagcc 724 

illlillllillll 

Sbjct: 1329 cccgctcaagagcc 1316 

CDS ■ 3. .2423 

>gi|21595817 | gb | BC032731 . 1 | Homo sapiens, Wolf -Hirschhorn syndrome candidate 
1, Identities = 14/14 (100%) 

Query: 713 cgctcaagagccag 726 

Illlillllillll 

Sbjct: 1876 cgctcaagagccag 1889 
source 1 . . 4239 

>gi | 19172410 | gb | AF480461 . 1 | Homo sapiens mixed lineage kinase -related kinase 
MRK- alpha mRNA, 
Identities = 14/14 (100%) 

Query: 715 ctcaagagccagtg 728 



Illllllllllll I 

Sbjct: 2454 ctcaagagccagtg 2467 
CDS ■ 196. .2598 

>gi|23272700|gb|BC035910.l| Homo sapiens, mitogen- activated protein kinase 
kinase kinase 7 interacting protein 2, 
Identities = 14/14 (100%) 

Query: 727 tggtacaccagaag 740 

IMIIIIIIIIIII 

Sbjct: 1758 tggtacaccagaag 1771 
CDS 149.. 2230 

>gi 1 10947029 j ref |NM_0062l7.2 | Homo sapiens serine (or cysteine) proteinase 
inhibitor, clade I (neuroserpin) , member 2 (SERPINI2) , mRNA 
Identities = 19/20 (95%) 

Query: 737 gaagtctacttttttttcta 756 

llllllllllllll Mill 

.: 927 gaagtctactttttgttcta 908 
34.. 1251 



4638453 | ref |NM__170665 . 1 1 Homo sapiens ATPase, Ca++ transporting, cardiac 
muscle, slow twitch 2 (ATP2A2) , mRNA 
Identities = 14/14 (100%) 

Query: 765 actttgtcaccaac 778 

llllllllllllll 

Sbjct: 586 actttgtcaccaac 573 
CDS 111.. 3239 

>gi | 21536291 1 ref |NM_001081 . 2 | Homo sapiens cubilin (intrinsic factor -cobalamin 
receptor) (CUBN) , 
Identities = 14/14 (100%) 

Query: 765 actttgtcaccaac 778 

llllllllllllll 

Sbjct: 8029 actttgtcaccaac 8042 

CDS 27.. 10898 

/note=" intrinsic factor- cobalamin receptor; intrinsic factor B 12 -receptor" 

,6912355 | ref |NM_012155 . 1 1 Homo sapiens echinoderm microtubule associated 
ftein like 2 (EML2) , 
[entities = 14/14 (100%) 

Query: 766 ctttgtcaccaact 77 9 

llllllllllllll 

Sbjct: 1595 ctttgtcaccaact 1608 
CDS 36. .1985 

>gi 1 18597004 | ref | XM_051693 . 4 | Homo sapiens mitogen inducible 2 (MIG2) , mRNA 
Identities = 15/15 (100%) 

Query: 768 ttgtcaccaacttct 782 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Sbjct: 838 ttgtcaccaacttct 852 
CDS: 238. .2280 

>gi|3335149|gb|AF055377.l|AF055377 Homo sapiens long form transcription factor 
C-MAF (c-maf) mRNA, 
Identities = 15/15 (100%) 
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Query: 771 tcaccaacttctcgt 785 

1 1 1 f 1 1 1 E 1 1 ] 1 1 1 1 

Sbjct: 1864 tcaccaacttctcgt 1850 
CDS 808.. 2019 

/note= n b-zip transcription factor" 

>gi|73 04920|ref | NM_0 13449 . 1 | Homo sapiens bromodomain adjacent to zinc finger 
domain, 2 A (BA22A) , 
Identities = 14/14 (100%) 

Query: 800 tgagtggaggacta 813 

1 1 1 1 ! M 1 1 1 1 1 i 1 

Sbjct: 1587 tgagtggaggacta 1600 
CDS 740.. 6376 

>gi| 5419653 | emb|AL034553. 12 |HS914P20 Human DNA sequence from clone RP5-914P20 
on chromosome 20ql3 . 13-13 .2 Contains the gene for activity-dependent 
neuro protective protein (ADNP, KIAA0784) , a PSMD10 (proteasome (prosome, 
>ain) 26S subunit, non-ATPase, 10) pseudogene, the DPMI gene fo> 
ties = 19/20 (95%) 




803 gtggaggactaataagactt 822 

I INI 1 1 III III MINI 

Sb^ct: 10723 gtggaggactaatgagactt 10704 misc_f eature : 10509.. 10953 

>gi|!4388625|gb|AF243083.l|F243081S03 Homo sapiens intrinsic factor -vitamin 
B12 receptor (CUBN) gene, exons 5 and 6 
Identities = 16/16 (100%) 

Query: 817 gacttatatactgtcc 832 

I M I II II II 1 1 1 1! I 

Sbjct: 809 gacttatatactgtcc 824 
CDS AF243085. 1:692. . 854 

>gi|24527258|gb|AY071904.l| Homo sapiens ribonuclease/angiogenin inhibitor 
(KNH) mRNA, complete 
Identities = 17/18 (94%) 

Query: 824 atactgtccgttctttga 841 

Ml I Mil III III Ml 

:t: 532 atactgtcagttctttga 515 
1..1386 




■gi | 9558724 |ref|NM_013291.l| Homo sapiens cleavage and poly adenylat ion 
specific factor 1, 160kDa(CPSFl) , mRNA 
Identities = 14/14 (100%) 

Query: 834 ttctttgagggagg 847 

iiiiiniiiiiii 

Sbjct: 1313 ttctttgagggagg 1300 
CDS 52.. 4380 

>gi | 20143921 | ref |NMJL33437 .1 1 Homo sapiens titin (TTN) , transcript variant 

novex-2, mKNA 

Identities = 14/14 (100%) 

Query: 838 ttgagggaggacct 851 

II I I I II II I II II 
Sbjct: 56027 ttgagggaggacct 56014 
CDS 224.. 81580 
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/note= n isoform novex-2 is encoded by transcript variant 
novex-2; connect in; CMH9, included" 

Query: 839 tgagggaggacctc 852 

illlllllllllll 

Sbjct: 819 tgagggaggacctc 832 

CDS 100.. 1155 

/product= n similar to ARP2/3 complex 41 kDa subunit (P41 -ARC) (Act in- related 
protein 2/3 complex subunit IB) " 

>gi 1 21426828 | ref |NM_JL44773 . 1 1 Homo sapiens G protein- coupled receptor 73-like 
1 (GPR73L1) , mRNA 

Identities = 14/14 (100%) 

Query: 848 gacctccctatgga 861 

Illlllllllllll 
Sbjct: 100 gacctccctatgga 113 CDS: 1..1155 

>gi 1 2 1327026 [gb | Ag50g288.l| Homo sapiens prokineticin receptor 2 (PKR2) mRNA, 
J^te cds 
il^Mties = 14/14 (100%) 

^R^t^p: 84 8 gacctccctatgga 861 ■ 

Illlllllllllll 
Sbjct: 100 gacctccctatgga 113 CDS 1..1155 

>gi | 7669541 1 ref | NM__013992 . 1 1 Homo sapiens paired box gene 8 (PAX8) , transcript 
variant PAX8E, 
Identities = 14/14 (100%) 

Query: 849 acctccctatggac 862 

illlllllllllll 

Sbjct: 582 acctccctatggac 595 CDS 161.. 1024 

>gi 1 16160856) ref | XM_0 07763 . 5 | Homo sapiens myosin VA (heavy polypeptide 12, 
myoxin) (MY05A) , mRNA 
Identities = 19/20 (95%) 

Query: 863 cgtaactggagagtctgggg 882 

Mill illlllllllllll 

ct: 724 cgtaagtggagagtctgggg 743 
>S 245. .5812 

duct=" similar to Myosin Va (Myosin 5A) (Dilute myosin 
vy chain, non-muscle) (Myosin heavy chain 12) (Myoxin)" 

>gi | 4757807 | ref |NM_001683 . 1 | Homo sapiens ATPase, Ca++ transporting, plasma 
membrane 2 (ATP2B2 ) , 
Identities = 15/15 (100%) 

Query: 865 taactggagagtctg 879 

II ! I ! 1 1 1 1 II II M 

Sbjct: 1298 taactggagagtctg 1312 

CDS 577.. 4173 

/note= n PMCA-2" 

>gi | 16904386 | ref |NM_013363.2 | Homo sapiens procollagen C-endopeptidase 
enhancer 2 (PCOLCE2) , mRNA 
Identities = 14/14 (100%) 

Query: 867 actggagagtctgg 880 

Illlllllllllll 
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Sbjct: 308 actggagagtctgg 321 
CDS . 197. .1444 

(^J' 6 ^^ |NM - 016507 ' 11 H ° m ° CDC2 - rel ^ted protein kinase 7 

Identities = 15/15 (100%) 

Query: 868 ctggagagtctgggg 882 

MllllllillllM 

Sb^ct: 2092 ctggagagtctgggg 2078 
CDS 34.. 4506 

Identities m 14/14 (100%) 
Query: 868 ctggagagtctggg 8 81 

iiiii n ii i in i 

SD^ct: 1570 ctggagagtctggg 1557 
CDS 1..5406 

Ses 5 i'l4/irU00%r' 21 HOm ° SapienS neur °^achin (NBEA) , mRNA 
id = Plus / Plus 

Query: 868 ctggagagtctggg 879 

mill in iiiii 

Sfcrjct: 3008 ctggagagtctggg 3021 
CDS 207.. 9047 

^din^tJIfl^i^raoo 8 ;) ' H ° m ° SaP±enS BCL8B Pr ° tein (BCL8B > ™' «^te 
Query: 868 ctggagagtctggg 881 

IMIIIIIIIIIM 

Sbjct: 3008 ctggagagtctggg 3 021 
CD S 207. .9047 

S^SL^I^S-a""- 1 ' H ° m ° SaPi£nS KIAA ° 9S3 Pr ° tein Cm«09«3) f nttHA 

^ry: 868 ctggagagtctgggg 8 82 
I I I I I I I I I ! I I I I I 
:t: 2832 ctggagagtctgggg 2846 CDS -216. .4316 

™ 1 ! '^ 722SS • 1 1 Howa sapiens si » il « to 605 * 

Identities = 16/16 (100%) 
Query: 869 tggagagtctggggtt 884 

OK . , 1 1 mi n in mi i 

Sfcgct: 530 tggagagtctggggtt 545 
CDS 1..579 

^iS?! 9 ^* 1 ^ 058 " 7 ' 11 HOm ° SaP±enS ^^tin-conjugating enzyme E2, « 
Identities = 14/14 (100%) 

Query: 870 ggagagtctggggt 883 

IMIIIIIIIIIM 

Sbjct: 652 ggagagtctggggt 63 9 
CDS 205.. 879 
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>gi | 23308602 |ref|NM_015460.l| Homo sapiens myosin VIIA and Rab interacting 
protein (MYRIP) , mRNA y 
Identities = 15/15 (100%) 

Query: 871 gagagtctggggttc 885 

^, iiiiiiiiniiiii 

StQct: 1861 gagagtctggggttc 1847 
CDS 137.. 2716 

>gi 1 6912705 |ref|NM_012455.l| Homo sapiens SEC7 homolog (TIC) mRNA 
Identities = 14/14 (100%) 

Query: 872 agagtctggggttc 885 

M MM I I HIM | 
Skrjct: 762 agagtctggggttc 749 
CDS 64.. 3234 

/note="ADP-ribosylation factor guanine nucleotide -exchange 
factor 6" 



2051239|ref |XM_048346 . 4 | Homo sapiens insulin receptor (INSR) , mRNA 
llties = 14/14 (100%) 




':884 tcgttgaccgtctt 897 

M . iiilllllllllll 

Sbjct: 3251 tcgttgaccgtctt 3238 
CDS -181. .4218 

>gi | 4507600 |ref|NM_003807.l| Homo sapiens tumor necrosis factor (ligand) 
superfamily, member 14 (TNFSF14 ) , mRNA 
Identities = 14/14 (100%) 

Query: 901 cggtcttacttcgg 914 

MMMIIIIMM 

Sbjct: 742 cggtcttacttcgg 755 
CDS 49.. 771 

^Ir 457 ° 9,gb|U89310 - l|AH005788S02 Hoino sapiens nucleophosmin phosphoprotein 
(NPM) gene, exon 2 

Identities = 14/14 (100%) 

ry: 908 acttcggttctttt 921 

I MMMMIMIM 

ct: 411 acttcggttctttt 424 CDS U89311 . 1 : 416 . . 535 

£gi I 20521002 |dbj|AB002333. 2 | Human mRNA for KIAA0335 gene/ partial cds 
Identities = 18/18 (100%) 

Query: 914 gttctttttaatttcttc 931 

eK . , 1 1 Mill I MUM MM 

Sbjct: 216 .gttctttttaatttcttc 233 CDS <829..5283 

^1 19923778 I r ^f |NM_006479.2| Homo .sapiens RAD51- interacting protein (PIR51) , 
mRNA 

Identities = 16/16 (100%) 

Query: 915 ttctttttaatttctt 930 

I I Iiilllllllllll 
Sbjct: 703 ttctttttaatttctt 688 
CDS 51.. 1058 
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>gx| 4505610) ref |NM__002582 . 1 1 Homo sapiens poly (A) -specific ribonuclease 
(deadenylation nuclease) (PARN) , mRNA 
Identities = 16/16 (100%) 

Query: 915 ttctttttaatttctt 930 

IN MINIMI I II I 

Sbjct: 1897 ttctttttaatttctt 1882 
CDS 58.. 1977 

>gi | 20538519 | ref |XM_057659 . 6 | Homo sapiens similar to RIKEN cDNA 2310005N03 
(LOC116228) , mRNA 
Identities = 18/18 (100%) 

Query: 915 ttctttttaatttcttct 932 

MMMMMMMMM 

Sbjct: 629 ttctttttaatttcttct 612 CDS 337.. 693 

>gi 1 18579348 | ref | XM_090294 . 1 | Homo sapiens similar to 10- 
formyltetrahydrofolate dehydrogenase (LOC160428) , mRNA 
S©g|^tities = 19/19 (100%) 

iXfyW* 916 tctttttaatttcttctac 934 

MIMMMMMMMM 

Sbjct: 2263 tctttttaatttcttctac 2245 CDS 1..2928 

>gi | 45 03510 | ref | NM_003758 . 1 | Homo sapiens eukaryotic translation initiation 
factor 3, subunit 1 alpha, 35kDa (EIF3S1) , mKNA 
Identities = 17/17 (100%) 

Query: 916 tctttttaatttcttct 932 

MMMMMMMMI 

Sbjct: 352 tctttttaatttcttct 336 CDS 61.. 837 

>gi|2327190l|gb|BC036021.l| Homo sapiens, Similar to Bmp2- inducible kinase/ 
Identities = 2 0/21 (95%) 

Query: 917 ctttttaatttcttctactac 937 

MMMMMMMM MM 

Sbjct: 796 ctttttaatttcttcttctac 776 
CDS 128. .2116 

(18375633 | ref |NM_004639 . 2 | Homo sapiens HLA-B associated transcript 3 
-T3) , transcript variant 1, mRNA 
entities = 15/15 (100%) 

Query: 931 ctactacgaggttct 945 

MMMMMMIM 

Sbjct: 1172 ctactacgaggttct 1186 CDS x 285.. 3683 

>gi 1 17485359 | ref |XM__066371. 1 1 Homo sapiens IiOC129184 (LOC129184) , mRNA 
Identities = 16/16 (100%) 

Query: 1016 tgtgggtgccagggtc 1031 

MMMMMMMM 

Sbjct: 866 tgtgggtgccagggtc 851 CDS 1..960 

>gi | 12653994 | gb | BC000795 . 1 | BC000795 Homo sapiens, hypothetical protein 
Identities = 15/15 (100%) 

Query: 1017 gtgggtgccagggtc 1031 

II III III! MMM 
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Sbjct: 306 gtgggtgccagggtc 292 CDS 49.. 1260 

>gi|l66874l|emb|X9'0762.l|HSHHA5GEN Homo sapiens hHa5 gene 
Identities = 16/16 (100%) 

Query: 1018 tgggtgccagggtctc 1033 

II III 1 1 Ml I II 1 1 ! 

Sbjct: 1215 tgggtg;ccagggtctc 1230 exon 1112.. 1365 number=8 

>gi 1 18582587 | ref |XM_090689 . 1 | Homo sapiens similar to S antigen precursor - 

malaria parasite (Plasmodium falciparum) (strain Wellcome) (LOC161088) , 

mRNA 

Identities = 19/20 (95%) 

Query: 1019 gggtgccagggtctcaggtg 1038 

IIIIIMM MMIIIIII 

Sbjct: 372 gggtgccagcgtctcaggtg 353 CDS 1..1221 Chr. 13 

^gi 1 9663549 [ emb [ AIO.57718 . 10 [ Human DMA sequence from clone RP11-23013 on 
gosome 20 Contains a putative novel gene, a CpG island, ESTs. and GSSs, 
?te sequence [Homo sapiens] 
Lties '= 19/20 (95%) 

Query: 1021 gtgccagggtctcaggtgca 1040 

l J 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 

Sbjct: 4 0364 gtgccagggtctcagctgca 4 0345 

misc__feature complement (40329 . .40883) note= n match: GSS: Em:AQ606491 n 

>gi| 35258 |emb|X13345.l|HSPAI19 Human gene for plasminogen activator inhibitor 
1 (PAI-1) exon 9/ Identities = 19/20 (95%) 

Query: 1024 ccagggtctcaggtgcagac 1043 

lllllllllllllll Mil 

Sbjct: 264 ccagggtctcaggtggagac 245 
precursorJRNA <1..1835 /not e= "primary transcript" 

>gi | 18581862 | ref | XMJD90590 . 1 1 Homo sapiens LOC16 092 5 (LOC160925) , mRNA 
Identities = 15/15 (100%) 

Query: 1064 agcaactctcgagtt 1078 

I I I I I II I I I I I I I I 
ct: 374 agcaactctcgagtt 360 CDS 1..870 




i| 24660383 |gb|BC039025.l| Homo sapiens, Similar to tyrosine 3- 
mooxygenase/tryptophan 5-monooxygenase activation protein, epsilon 
polypeptide, clone MGC : 4 7 8 0 5 IMAGE : 6070099 , mRNA, 
Identities = 17/17 (100%) 

Query: 1077 tttcgattttgctgtgg 1093 

III Mill MINI II I 

Sbjct: 58 tttcgattttgctgtgg 74 
CDS 107.. 883 

>gi 1 18253109 | dbj | AB065437.1) Homo sapiens Cls gene for complement Cls, 
promoter region and exon 1 
Identities = 15/15 (100%) 

Query: 1112 ttttcgggaaagtca 1124 (Exon wechsel) 

I I II I I I I I I I I I I I 
Sbjct: 2584 ttttcgggaaagtca 2570 
promoter 1..2826 
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/function=" complement activation" 
exon 2827. .2978 

>gi | 22047240 | ref | XM_175003 . 1 1 Homo sapiens L0C256626 (LOC256626) , mRNA 
Identities = 15/15 (100%) 

Query: 1785 gaaaagtgacctgaa 1799 

1 1 Mill I INI 1 1 1 

Sbjct: 1768 gaaaagtgacctgaa 1754 CDS 1..1914 

>gi| 11990557 |gb|AF170052.l|AF170052 HIV-2 isolate 97227 from France envelope 
glycoprotein (env) gene, partial cds 
Identities = 15/15 (100%) 

Query: 1825 gtatggcctctgtcc 1839 

I III Ml 1 1 1 II M I 

Sbjct: 866 gtatggcctctgtcc 852 CDS <1..>2243 

>gi| 4 502528 | ref [ NM_000721 . 1 | Homo sapiens calcium channel, voltage - dependent , 
IE subunit ( CACNA1E ) , mRNA, note="brain specific" 
kties = 15/15 (100%) 




r : 1827 atggcctctgtccgg 1841 
I 1 I I 1 I 1 I I I I I I I I 

Sbjct: 1433 atggcctctgtccgg 1419 CDS 166.. 6921 

>gi | 20559017 | ref |XMJL66786 . 1 | Homo sapiens similar to SDMO-1 activating enzyme 
subunit 1; SUMO-1 activating enzyme El N subunit; sent rin/ SUMO -activating 
protein AOS1; ubiqui tin- like protein SUMO-1 activating enzyme (LOC220311) , mRNA 
Identities = 16/16 (100%) 

Query: 1842 gatacacacggggaag 1857 

niiiiiiiliiilll 

Sb;)Ct: 886 gatacacacggggaag 901 CDS 1..1134 

/gene=»LOC220311">gi | 4758617 | ref |NM_004693.1 I Homo sapiens cytokeratin type II 
(K6HF), mRNA 

Identities = 16/16 (100%) 

Query: 1845 acacacggggaagctg 1860 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

t: 3 66 acacacggggaagctg 351 CDS 19.11674 



a. 1 17149843 | ref |NM_057092.l| Homo sapiens FK506 binding protein 2, 13kDa 
FKBP2) , transcript variant 2, mRNA 
Identities = 14/14 (100%) 

Query: 1847 acacggggaagctg 1860 

llllllllllllll 

Sbjct: 269 acacggggaagctg 282 
CDS 103. .531 

misc__f eature 223 . . 504 

/note="FKBP; Region: FKBP-type peptidyl -prolyl cis-trans isomerase" 

>gi | 20127426 | ref |NM_002252 . 2 | Homo sapiens potassium voltage-gated channel, 
delayed- rectifier, subfamily S, member 3 (KCNS3) , mRNA 
Identities = 15/15 (100%) 

Query: 1847 acacggggaagctgc 1861 

1 1 1 II M 1 1 i 1 1 1 1 1 

Sbjct: 653 acacggggaagctgc 667 
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CDS 403.. 1878 

>gi|2498101o|gb|BC039695.l| Homo sapiens, Janus kinase 2 (a protein tyrosine 
kinase) , clone 
Identities = 14/14 (100%) 

Query: 1865 cattattcttcaaa 1878 

Mil II i II I Ml | 

Sbjct: 3354 cattattcttcaaa 3341 
CDS 108.. 3497 

>gi|20l49552|ref | NM_0 04414 . 3 | Homo sapiens Down syndrome critical region gene 
1 (DSCR1) , mRNA 
Identities = 15/15 (100%) 

Query: 1872 cttcaaacgagtcag 1886 

lllllllllllllll 

Srrjct: 215 cttcaaacgagtcag 229 
CDS 66. .659 

48540|gb|U53821.l|HSU53821 Homo sapiens adapt78 protein gene, partial 
ities = 15/15 (100%) 

Query: 1872 cttcaaacgagtcag 1886 

lllllllllllllll 

Sbjct: 219 cttcaaacgagtcag 233 
CDS 70..>562 

>gi| 8922685) ref | NM_018228 . 1 1 Homo sapiens hypothetical protein FLJ10811 
(FLJ10811) , mRNA 
Identities = 17/17 (100%) 

Query: 1955 ctggaagagctggggcc 1971 

MIMIMMIIIIIII 

Sbjct: 923 ctggaagagctggggcc 907 CDS 146.. 2254 

>gi|l729830l|gb|AF283402.l|F283327S74 Homo sapiens candidate tumor suppressor 
protein (LRP1B) gene, exon 76 
Identities = 17/17 (100%) 

ry: 2034 ttcttaaaatttttact 2050 

IIIMIIIIMIMI II 

ct: 307 ttcttaaaatttttact 291 CDS • 
in(AF283376.1:<285. . 407 , AF283377 

>gi | 2 0545629 | ref | XMJL21159 . 1 1 Homo sapiens LOC206321 (LOC206321) , mRNA 
Identities = 25/28 (89%) 

Query: 2133 agatagaacgagacattagagcaaagtt 2161 

"INN MINI II I II I II I III 1 1 

Sbjct: 527 agatagaacgagatctgagagcaaagtt 500 CDS 1..1176 

>gi | 22054646 | ref | XM_069110 . 2 | Homo sapiens similar to hypothetical protein 
FLJ23231 (LOC134973) , mRNA 
Identities = 16/16 (100%) 

Query: 2155 caaagtttttgttcca 2170 

MM I Mill MM 1 1 

Sbjct: 915 caaagtttttgttcca 930 CDS 1..2475 
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tV r f l^ 1 - 0073 "- 1 ! Homo sapiens v-abl Abelson murine leukemia viral 
oncogene homolog l(ABLl), transcript variant b, mRNA 
Identities = 18/18 (100%) 

Query: 2163 ttgttccacaaaaacatt 2180 

i ii mm minimi 

Strjct: 135 ttgttccacaaaaacatt 118 CDS 1..3447 

^l^^f^f 1 95]£SJ? S7 J « l*»°** 5T * Homo sa P ie ^ translocation related non- 
coding gene (TNRG10) mRNA, complete sequence 
Identities = 17/17 (100%) 

Query: 2164 tgttccacaaaaacatt 2180 

Mil 1 1 INI INI Ml 

Stgct: 2361 tgttccacaaaaacatt 2345 
gene 1..2726 
repeat_region 3 2 6 54 7 
repeat_region 2599 . . 2709 

11 (BB/SHR) 

—5 "^f 3 | «f | NM_0062BX . 1 1 Homo sapiens protein kinase, AMP-activated, alpha 
catalytic subunit (PRKAA1) , mRNA P 

Identities = 16/16 (100%) 




Query: 316 tcttctgagcactcaa 331 

MM II UN II MM 

Sbjct: 943 tcttctgagcactcaa 928 

CDS 24.. 1676 

note^'AMPK alpha 1; Protein kinase, AMP-activated, catalytic, alpha- 1 - 

>gi | 23503326 | ref |NM_018682 . 2 | Homo sapiens myeloid/ lymphoid or mixed-lineage 
leukemia 5 (tn thorax homolog, Drosophila) (MHL5) , mRNA 
Identities = 16/16 (100%) 

ery: 365 catcagatgaaggatc 380 

IMIIMIMI Mill 

t: 1003 catcagatgaaggatc 988 
S 202.. 5778 

ote=" contains PHD and SET domains; similar to Drosophila trithorax" 
/products "myeloid/lymphoid or mixed-lineage leukemia 5 

>gi | 1418773 | emb |X97186.1 | HSE14 H. sapiens mRNA for E14 protein 
Identities ■ 17/17 (100%) 

Query: 428 gaagacaaagagttctt 444 

MM I Mill 1 1 MM I 

Sbjct: 1509 gaagacaaagagttctt 1493 
CDS 35. .4318 

>gi|l381666|gb|U58852.l|HSIT58852 Human NPAT mRNA, complete cds 
Identities = 17/17 (100%) 

Query: 428 gaagacaaagagttctt 444 
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1 1 1 1 1 1 1 1 1 1*1 1 1 1 1 1 1 

Sirjct: 1475 gaagacaaagagttctt 1459 

CDS 1..3528 
/note= "predicted amino acids have three regions which share similarity to 
annotated domains of transcriptional factor oct-l, nucleolus -cytoplasm shuttle 
phosphoprotein and protein kinases" 

>gi | 22065878 | ref | XM_040846 . 5 | Homo sapiens nuclear protein, ataxia- 
telangiectasia locus (NPAT) , 
Identities = 17/17 (100%) 

Query: 428 gaagacaaagagttctt 444 

MM I MM I II Mill 

Sfcrjct; 1509 gaagacaaagagttctt 1493 

CDS 35.. 4318 

/products "similar to NPAT" 

>gi 1 18079322 | ref |NM_080612 . 1 1 Homo sapiens GRB2 -associated binding protein 3 
(GAB 3 ) , mRNA 

ities b 17/17 (100%) 




578 ggggtccaagaccagag 594 

Mlllllllllllllll 

Sb^ct: 1254 ggggtccaagaccagag 1238 

CDS 33.. 1793 

/functions "differentiation signaling" 

>gi 1 20270211 1 ref |NMJ)333 96 . 1 1 Homo sapiens tankyrase 1 binding protein 1, 
182kDa (TNKS1BP1) , mRNA 

Identities = 16/16 (100%) 



Query: 583 ccaagaccagagtaaa 598 

Mill IMIII II III 

Sbjct: 2725 ccaagaccagagtaaa 2740 
CDS 308.. 5497 

oduct=" tankyrase 1-binding protein of 182 kDa" 

6462 |ref | NMJD00038 . 2 | Homo sapiens adenomatosis polyposis coli (APC) , 
dentities = 16/16 (100%) . 

Query: 616 gaccaaaaaggaactg 631 

Ml III MM 1 1 mi 

Sb^ct: 8232 gaccaaaaaggaactg 8247 

CDS 39.. 8570 

/products "adenomatosis polyposis coli" 
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